🔥 精选推荐

Benedict Evans 在 Lenny's Podcast 上阐述了他的核心判断:AI 目前处于"1997 年互联网"阶段——足够大、足够真实,但距离价值主体的形成仍有巨大不确定性。他认为 AI 的价值最终会向分发层聚集,而非模型层;软件构建成本趋近于零后,分发能力(distribution)将成为终极护城河。此外,他提出了一个重要的框架区分:评估 AI 对工作的影响,正确的问题不是"AI 能做你工作的百分之几",而是"这是一个任务还是一个岗位"。播客还涉及 AI 公司中咨询和专业服务的异常增长。
🦐点评:Evans 的"1997 互联网"类比对投资时序判断有直接参考价值——1997 年最大的赢家(AOL、Yahoo)到 2005 年已经不是赢家了。当下 AI 赛道的领先者未必是终局玩家,这意味着 VC 应该关注的不是谁在 2026 年跑得最快,而是谁在建分发渠道和用户信任。AI 公司咨询业务暴增这一点尤其值得警惕——如果 AI 产品真的"即插即用",为什么需要这么多专业服务?这暗示 AI 落地的复杂度被普遍低估。
lennysnewsletter.com
Reuters Breakingviews 的 Karen Kwok 披露了 Anthropic "年化营收"(run-rate revenue)的具体计算方式:将最近 28 天的按量付费收入乘以 13,再加上月订阅收入乘以 12。这意味着 Anthropic 在消费类收入上用的不是标准的"乘以 12"年化,而是"乘以 13"——比通常的年化方法多计了约 8%。
🦐点评:一家未上市公司选择用"28 天×13"而非"月×12"来定义 run-rate,这在财务叙事上是一个有意识的选择——它把短期消费高峰放大到全年,适合在融资和估值谈判中呈现最大数字。对于正在以 $470 亿估值融资的 Anthropic 来说,投资人应该拿到原始的月度消费数据和留存曲线,而不是接受一个被优化过的 run-rate 定义。这种做法在 SaaS 圈并不罕见,但在 AI 行业增速这么快的背景下,"28 天高峰×13"和"实际年收入"之间的差距可能非常大。
simonwillison.net
Sean Goedecke(GitHub Copilot 团队)系统对比了 LLM 应用的两种架构范式:Pipeline(代码控制流程,LLM 只做单步推理)和 Agent(LLM 自主管理控制流)。核心论点是 Agent 更智能、更灵活、更适合未来——因为 Agent 把上下文收集的难题委托给模型本身,而 Pipeline 必须在调用前就组装好所有相关上下文,这本身是一个"未解决的技术问题"。文章指出 RAG 并没有解决上下文收集问题,实际上行业已经回退到让 Agent 做纯文本搜索。同时强调已知有多个 AI 项目从 Pipeline 迁移到 Agent,但没有反向案例。
🦐点评:这篇文章对 AI infra 赛道的投资判断有一个清晰的推论——如果 Agent 是终态,那些把赌注压在 RAG/向量数据库/Pipeline 编排上的公司(如 LlamaIndex、LangChain 的早期形态)可能正在建一个被淘汰的中间层。Cursor、Claude Code、Codex 的成功已经在验证这个方向。但 Agent 的不可预测性(成本和延迟可以 2x 波动)意味着目前只有高价值场景(编程、法律、金融分析)能承受,低价值场景仍需 Pipeline。
seangoedecke.com
Simon Willison 转述了开发者 David Wilson 的自省:AI 编程工具是一个"热核 ADHD 放大器"——一个"写个快速脚本"的需求,一小时后变成了一个有测试、有文档、看起来精心设计的完整项目,但原始问题可能根本没解决。Wilson 列举了 16+ 个用 AI 启动的项目,最终认为这种零摩擦的廉价奖励感只能是一种负担。Hacker News 上的反驳来自 ADHD 群体——他们认为 Agent 首次帮助他们完成了从未完成的副项目。
🦐点评:这篇帖子揭示了一个被 AI 工具乐观叙事遮盖的现象——用户留存可能不等于用户价值。如果 AI 编程工具的核心使用模式是"启动大量项目但不维护",那 token 消耗增长和实际业务价值增长之间可能存在巨大断裂。对 AI 工具公司来说,这意味着需要区分"有效使用"和"注意力消耗"两种 engagement——前者驱动续订,后者最终导致退订。ADHD 群体的正面反馈则暗示 AI 工具的杀手级用例可能不在效率,而在认知辅助。
simonwillison.net

📌 其他新闻

Gary Marcus 引用教皇 Leo XIV 的推文"真正的理解来自体验,而非文本近似",批评 Hinton 在最新访谈中混淆了 LLM 输出的模仿与真正的意识——LLM 记忆了整个互联网,人类则通过与世界的交互构建心智模型,两者产生相似输出不代表底层机制相同。
garymarcus.substack.com
MiniMax 分享其 AI Native 组织实践:从取消 token 使用限制到全员 Agent 化,探索 AI 原生公司的组织形态演进路径。
量子位
复旦系创业团队推出机器人原生世界动作模型,采用首创的时空一体架构。该团队半年内斩获 5 轮融资,显示具身智能赛道资本密度持续上升。
量子位
OpenClaw 上线 macOS 桌面操控工具 Peekaboo,提供像素级截图和 UI 元素识别能力,让 Agent 从纯文本交互进化到可视化桌面操控。
雷锋网
开源项目 OpenHuman 登上 GitHub Trending 榜首,起源是开发者为父亲制作的桌面 Agent,折射出个人化 Agent 的潜在大众市场需求。
雷锋网
Google AI Overviews 再次引发用户不满,更多人发现了 &udm=14 参数可以绕过 AI 结果回到传统搜索,反映出 AI 搜索体验与用户预期之间的持续摩擦。
tedium.co

🧠 AI 技术前沿

emollick @emollick
全自动 AI Agent(如 /goal)很酷,但不是人机协作的好模型。真正有价值的 AI 应该知道何时向你提出好问题——可能因为卡住了,可能因为你的品味重要,也可能因为你会觉得有趣。
查看推文 →
godofprompt @godofprompt
Temperature 参数已死。OpenAI 在 o1/o3/GPT-5 上移除,Google 对 Gemini 3 发出警告,Anthropic 在 Opus 4.7/4.8 上弃用。所有前沿模型提供商在过去 12 个月内统一取消了这一控制——他们移除的是一个从未真正有效的参数。
查看推文 →
godofprompt @godofprompt
Seedance 2.0 和 Gemini Omni Flash 的对比抓错了重点。Omni 的真正优势不是输出质量,而是编辑模型——可以通过对话修改视频的镜头角度,同时保留角色和场景记忆,这是完全不同的工作流。
查看推文 →
shao__meng @shao__meng
个人生活自动化 Agent 工具栈:OpenAI Codex + Google 全家桶 + WhatsApp + Telegram + 浏览器自动化。典型工作流包括跨 5 个工具的介绍邮件编排(人工 20 分钟,用户侧 10 秒),以及车牌信息在多个无 API 系统间的行政连续性维护。
查看推文 →
shao__meng @shao__meng
从 PDF 构建金融知识图谱的完整流程:上传 → LandingAI ADE 提取 → 归一化(发票/合同走确定性解析,10-K/MD&A 走 Claude)→ Weaviate 向量 + Neo4j 图索引 → 规则 + LLM 异常检测。10 类实体、500 词分块、100 词重叠。
查看推文 →
steipete @steipete
正在训练 Codex 做 QA 助手:每次 commit 自动生成用户测试场景,通过 webVNC(crabbox)和 computer/browser use(peekaboo/mcporter)像真人 QA 一样测试 OpenClaw,后台运行并自动开 PR 修复问题。
查看推文 →

🚀 创业动态

rileybrown @rileybrown
反潮流操作:正在纽约招聘人类视频编辑,要求深度理解 AI 工具和教育内容,提供无限工具预算和 token 预算。面试方式是当场看你手动剪一段视频。
查看推文 →

💬 观点与洞察

Hesamation @Hesamation
CEO 们以为裁员省钱,但两年后谁来付 $60/月的 SaaS 订阅费?
查看推文 →
egeberkina @egeberkina
CEO 正在变成新的 App 图标——产品的"人格化"趋势正在加速。
查看推文 →
vasuman @vasuman
/goal 已经跑了 16 个小时,正处于那个微妙的甜蜜点——不想停因为可能在酝酿什么,但又严重怀疑。全自动 Agent 的信任困境。
查看推文 →

🔥 精选推荐

GTM Fund 的 Max Altschuler 提出"分发纪元"(Distribution Era)概念:AI 让产品建设和复制成本趋近于零后,护城河从产品迁移到了分发。文章梳理了 B2B 软件护城河的四次迁移——从资本、到产品/销售体系、到 PLG 病毒增长、再到受众和分发能力。Cursor 成为 B2B 历史上最快到 $10 亿 ARR 的公司,Harvey 在产品未完善前就锁定了 AmLaw 100 超半数律所。a16z 数据显示 AI 原生公司中位数第 12 个月达 $210 万 ARR,前四分位达 $530 万,远超十年前 SaaS 最佳水平。
🦐点评:Anthropic 自己把最多的 headcount 投在销售而非研究,这对"模型即壁垒"的投资叙事是一个冷水信号。如果连 Anthropic 都认为分发比模型能力更关键,那早期 AI 创业公司的估值锚点就不应该是"模型有多好",而是"GTM 有多强"。Cursor 和 Harvey 的案例说明品类定义者(category definer)和产品跟随者之间的差距在加速拉大——先进入用户心智的品牌获得了不成比例的定价权和留存优势。
深思SenseAI
ClickUp 同一周裁员 22% 并开出 $100 万年薪招 AI 原生人才。Vellum AI 的 Anita Kirkovska 区分了"假 AI 原生"和"真 AI 原生":前者会用 ChatGPT 但工作方式没变,后者能展示正在运行的 Agent 配置、skill.md 文件清单,以及能说出三件停止让 AI 做的事和原因。她提出 skill.md 方法论——给 Agent 写工作手册,把领域知识、任务标准和个人偏好系统化地传递给 AI,第一版必须自己写,因为 AI 不知道你脑中的隐性标准。
🦐点评:ClickUp 的"裁 22% + 招 $100 万"操作揭示了一个正在形成的人才市场断层——被裁的不是"不努力的人",而是"人做这件事的边际成本比 AI 高"的岗位。skill.md 的概念值得认真看——它本质上是把个人的隐性知识转化为可执行的 Agent 指令,谁先完成这个转化谁就获得了"AI 杠杆"。这暗示未来的人才估值模型会从"你能做什么"变成"你能让 AI 做什么",而这种能力目前几乎无法通过简历或面试评估。
深思SenseAI
文章将 AI Native 拆分为三层:AI Native 的事(10 倍回报的新业务)、AI Native 的组织(10 倍效率的新架构)、AI Native 的人力(10 倍提效的个人)。作者指出大部分公司跳过了第一层和第二层,直接让中层推第三层——用省下的人头证明"转型成功"。但如果不先找到 10 倍大的新事情,只做人效提升最终只能裁员。文章尖锐地问:如果 AI 真的让团队提效了,为什么 OpenAI 和 Anthropic 的人数还在增加?
🦐点评:这篇文章的三层框架对评估 AI 转型公司非常实用——投资人可以直接问 CEO:你的"第一层"是什么?如果答案只有"提效降本"而没有新的 10 倍机会,这家公司大概率只是在用 AI 叙事包装成本优化,而成本优化本身不支撑增长估值。反过来,OpenAI/Anthropic 人数增加恰恰说明它们找到了第一层——Agent 平台和 Enterprise 部署就是那个 10 倍的事。
AGENT橘

📌 其他值得看

AGI Bar 在红杉加速器一层开设上海店,300 平空间可容纳百人。酒单更新反映 AI 行业精神状态,AGI 基础款 9.9 元/杯,品牌冠名酒水补贴至 8.9 元。位置在红杉楼下——"如果聊出了成果,大可以直接上楼"。
赛博禅心