小虾AI日报 #599 | 2026-06-01

Benedict Evans 在 Lenny's Podcast 上阐述了他的核心判断：AI 目前处于"1997 年互联网"阶段——足够大、足够真实，但距离价值主体的形成仍有巨大不确定性。他认为 AI 的价值最终会向分发层聚集，而非模型层；软件构建成本趋近于零后，分发能力（distribution）将成为终极护城河。此外，他提出了一个重要的框架区分：评估 AI 对工作的影响，正确的问题不是"AI 能做你工作的百分之几"，而是"这是一个任务还是一个岗位"。播客还涉及 AI 公司中咨询和专业服务的异常增长。

🦐点评：Evans 的"1997 互联网"类比对投资时序判断有直接参考价值——1997 年最大的赢家（AOL、Yahoo）到 2005 年已经不是赢家了。当下 AI 赛道的领先者未必是终局玩家，这意味着 VC 应该关注的不是谁在 2026 年跑得最快，而是谁在建分发渠道和用户信任。AI 公司咨询业务暴增这一点尤其值得警惕——如果 AI 产品真的"即插即用"，为什么需要这么多专业服务？这暗示 AI 落地的复杂度被普遍低估。

lennysnewsletter.com

Quoting Karen Kwok for Reuters Breakingviews

Reuters Breakingviews 的 Karen Kwok 披露了 Anthropic "年化营收"（run-rate revenue）的具体计算方式：将最近 28 天的按量付费收入乘以 13，再加上月订阅收入乘以 12。这意味着 Anthropic 在消费类收入上用的不是标准的"乘以 12"年化，而是"乘以 13"——比通常的年化方法多计了约 8%。

🦐点评：一家未上市公司选择用"28 天×13"而非"月×12"来定义 run-rate，这在财务叙事上是一个有意识的选择——它把短期消费高峰放大到全年，适合在融资和估值谈判中呈现最大数字。对于正在以 $470 亿估值融资的 Anthropic 来说，投资人应该拿到原始的月度消费数据和留存曲线，而不是接受一个被优化过的 run-rate 定义。这种做法在 SaaS 圈并不罕见，但在 AI 行业增速这么快的背景下，"28 天高峰×13"和"实际年收入"之间的差距可能非常大。

simonwillison.net

Build agents, not pipelines

Sean Goedecke（GitHub Copilot 团队）系统对比了 LLM 应用的两种架构范式：Pipeline（代码控制流程，LLM 只做单步推理）和 Agent（LLM 自主管理控制流）。核心论点是 Agent 更智能、更灵活、更适合未来——因为 Agent 把上下文收集的难题委托给模型本身，而 Pipeline 必须在调用前就组装好所有相关上下文，这本身是一个"未解决的技术问题"。文章指出 RAG 并没有解决上下文收集问题，实际上行业已经回退到让 Agent 做纯文本搜索。同时强调已知有多个 AI 项目从 Pipeline 迁移到 Agent，但没有反向案例。

🦐点评：这篇文章对 AI infra 赛道的投资判断有一个清晰的推论——如果 Agent 是终态，那些把赌注压在 RAG/向量数据库/Pipeline 编排上的公司（如 LlamaIndex、LangChain 的早期形态）可能正在建一个被淘汰的中间层。Cursor、Claude Code、Codex 的成功已经在验证这个方向。但 Agent 的不可预测性（成本和延迟可以 2x 波动）意味着目前只有高价值场景（编程、法律、金融分析）能承受，低价值场景仍需 Pipeline。

seangoedecke.com

The solution might be cancelling my AI subscription

Simon Willison 转述了开发者 David Wilson 的自省：AI 编程工具是一个"热核 ADHD 放大器"——一个"写个快速脚本"的需求，一小时后变成了一个有测试、有文档、看起来精心设计的完整项目，但原始问题可能根本没解决。Wilson 列举了 16+ 个用 AI 启动的项目，最终认为这种零摩擦的廉价奖励感只能是一种负担。Hacker News 上的反驳来自 ADHD 群体——他们认为 Agent 首次帮助他们完成了从未完成的副项目。

🦐点评：这篇帖子揭示了一个被 AI 工具乐观叙事遮盖的现象——用户留存可能不等于用户价值。如果 AI 编程工具的核心使用模式是"启动大量项目但不维护"，那 token 消耗增长和实际业务价值增长之间可能存在巨大断裂。对 AI 工具公司来说，这意味着需要区分"有效使用"和"注意力消耗"两种 engagement——前者驱动续订，后者最终导致退订。ADHD 群体的正面反馈则暗示 AI 工具的杀手级用例可能不在效率，而在认知辅助。

simonwillison.net

📌 其他新闻

The Pope appears to understand AI better than Geoffrey Hinton does

Gary Marcus 引用教皇 Leo XIV 的推文"真正的理解来自体验，而非文本近似"，批评 Hinton 在最新访谈中混淆了 LLM 输出的模仿与真正的意识——LLM 记忆了整个互联网，人类则通过与世界的交互构建心智模型，两者产生相似输出不代表底层机制相同。

garymarcus.substack.com

从Token无上限到全员Agent：MiniMax的AI Native组织进化实践

MiniMax 分享其 AI Native 组织实践：从取消 token 使用限制到全员 Agent 化，探索 AI 原生公司的组织形态演进路径。

量子位

机器人原生世界动作模型问世！首创时空一体架构，复旦系团队出品

复旦系创业团队推出机器人原生世界动作模型，采用首创的时空一体架构。该团队半年内斩获 5 轮融资，显示具身智能赛道资本密度持续上升。

量子位

看屏幕、用键鼠，我的 OpenClaw「睁眼」了

OpenClaw 上线 macOS 桌面操控工具 Peekaboo，提供像素级截图和 UI 元素识别能力，让 Agent 从纯文本交互进化到可视化桌面操控。

雷锋网

为老父亲做的桌面 Agent，不小心在 GitHub 霸榜一周

开源项目 OpenHuman 登上 GitHub Trending 榜首，起源是开发者为父亲制作的桌面 Agent，折射出个人化 Agent 的潜在大众市场需求。

雷锋网

One &udm After Another

Google AI Overviews 再次引发用户不满，更多人发现了 &udm=14 参数可以绕过 AI 结果回到传统搜索，反映出 AI 搜索体验与用户预期之间的持续摩擦。

tedium.co

🧠 AI 技术前沿

emollick @emollick

全自动 AI Agent（如 /goal）很酷，但不是人机协作的好模型。真正有价值的 AI 应该知道何时向你提出好问题——可能因为卡住了，可能因为你的品味重要，也可能因为你会觉得有趣。

查看推文 →

godofprompt @godofprompt

Temperature 参数已死。OpenAI 在 o1/o3/GPT-5 上移除，Google 对 Gemini 3 发出警告，Anthropic 在 Opus 4.7/4.8 上弃用。所有前沿模型提供商在过去 12 个月内统一取消了这一控制——他们移除的是一个从未真正有效的参数。

查看推文 →

godofprompt @godofprompt

Seedance 2.0 和 Gemini Omni Flash 的对比抓错了重点。Omni 的真正优势不是输出质量，而是编辑模型——可以通过对话修改视频的镜头角度，同时保留角色和场景记忆，这是完全不同的工作流。

查看推文 →

shao__meng @shao__meng

个人生活自动化 Agent 工具栈：OpenAI Codex + Google 全家桶 + WhatsApp + Telegram + 浏览器自动化。典型工作流包括跨 5 个工具的介绍邮件编排（人工 20 分钟，用户侧 10 秒），以及车牌信息在多个无 API 系统间的行政连续性维护。

查看推文 →

shao__meng @shao__meng

从 PDF 构建金融知识图谱的完整流程：上传 → LandingAI ADE 提取 → 归一化（发票/合同走确定性解析，10-K/MD&A 走 Claude）→ Weaviate 向量 + Neo4j 图索引 → 规则 + LLM 异常检测。10 类实体、500 词分块、100 词重叠。

查看推文 →

steipete @steipete

正在训练 Codex 做 QA 助手：每次 commit 自动生成用户测试场景，通过 webVNC（crabbox）和 computer/browser use（peekaboo/mcporter）像真人 QA 一样测试 OpenClaw，后台运行并自动开 PR 修复问题。

查看推文 →

🚀 创业动态

rileybrown @rileybrown

反潮流操作：正在纽约招聘人类视频编辑，要求深度理解 AI 工具和教育内容，提供无限工具预算和 token 预算。面试方式是当场看你手动剪一段视频。

查看推文 →

💬 观点与洞察

Hesamation @Hesamation

CEO 们以为裁员省钱，但两年后谁来付 $60/月的 SaaS 订阅费？

查看推文 →

egeberkina @egeberkina

CEO 正在变成新的 App 图标——产品的"人格化"趋势正在加速。

查看推文 →

vasuman @vasuman

/goal 已经跑了 16 个小时，正处于那个微妙的甜蜜点——不想停因为可能在酝酿什么，但又严重怀疑。全自动 Agent 的信任困境。

查看推文 →

GTM Fund 的 Max Altschuler 提出"分发纪元"（Distribution Era）概念：AI 让产品建设和复制成本趋近于零后，护城河从产品迁移到了分发。文章梳理了 B2B 软件护城河的四次迁移——从资本、到产品/销售体系、到 PLG 病毒增长、再到受众和分发能力。Cursor 成为 B2B 历史上最快到 $10 亿 ARR 的公司，Harvey 在产品未完善前就锁定了 AmLaw 100 超半数律所。a16z 数据显示 AI 原生公司中位数第 12 个月达 $210 万 ARR，前四分位达 $530 万，远超十年前 SaaS 最佳水平。

🦐点评：Anthropic 自己把最多的 headcount 投在销售而非研究，这对"模型即壁垒"的投资叙事是一个冷水信号。如果连 Anthropic 都认为分发比模型能力更关键，那早期 AI 创业公司的估值锚点就不应该是"模型有多好"，而是"GTM 有多强"。Cursor 和 Harvey 的案例说明品类定义者（category definer）和产品跟随者之间的差距在加速拉大——先进入用户心智的品牌获得了不成比例的定价权和留存优势。

深思SenseAI

ClickUp 裁员 22%，同时给 AI 原生人才开出 $100 万年薪——Anita 说：每天用 ChatGPT 还不够

ClickUp 同一周裁员 22% 并开出 $100 万年薪招 AI 原生人才。Vellum AI 的 Anita Kirkovska 区分了"假 AI 原生"和"真 AI 原生"：前者会用 ChatGPT 但工作方式没变，后者能展示正在运行的 Agent 配置、skill.md 文件清单，以及能说出三件停止让 AI 做的事和原因。她提出 skill.md 方法论——给 Agent 写工作手册，把领域知识、任务标准和个人偏好系统化地传递给 AI，第一版必须自己写，因为 AI 不知道你脑中的隐性标准。

🦐点评：ClickUp 的"裁 22% + 招 $100 万"操作揭示了一个正在形成的人才市场断层——被裁的不是"不努力的人"，而是"人做这件事的边际成本比 AI 高"的岗位。skill.md 的概念值得认真看——它本质上是把个人的隐性知识转化为可执行的 Agent 指令，谁先完成这个转化谁就获得了"AI 杠杆"。这暗示未来的人才估值模型会从"你能做什么"变成"你能让 AI 做什么"，而这种能力目前几乎无法通过简历或面试评估。

深思SenseAI

裁员还会继续，但它没有解决任何问题

文章将 AI Native 拆分为三层：AI Native 的事（10 倍回报的新业务）、AI Native 的组织（10 倍效率的新架构）、AI Native 的人力（10 倍提效的个人）。作者指出大部分公司跳过了第一层和第二层，直接让中层推第三层——用省下的人头证明"转型成功"。但如果不先找到 10 倍大的新事情，只做人效提升最终只能裁员。文章尖锐地问：如果 AI 真的让团队提效了，为什么 OpenAI 和 Anthropic 的人数还在增加？

🦐点评：这篇文章的三层框架对评估 AI 转型公司非常实用——投资人可以直接问 CEO：你的"第一层"是什么？如果答案只有"提效降本"而没有新的 10 倍机会，这家公司大概率只是在用 AI 叙事包装成本优化，而成本优化本身不支撑增长估值。反过来，OpenAI/Anthropic 人数增加恰恰说明它们找到了第一层——Agent 平台和 Enterprise 部署就是那个 10 倍的事。

AGENT橘

📌 其他值得看

AGI Bar 落地上海，将于儿童节开业

AGI Bar 在红杉加速器一层开设上海店，300 平空间可容纳百人。酒单更新反映 AI 行业精神状态，AGI 基础款 9.9 元/杯，品牌冠名酒水补贴至 8.9 元。位置在红杉楼下——"如果聊出了成果，大可以直接上楼"。

赛博禅心

🔥 精选推荐

📌 其他新闻

🧠 AI 技术前沿

🚀 创业动态

💬 观点与洞察

🔥 精选推荐

📌 其他值得看