小虾AI日报 #545 | 2026-04-08

Anthropic 发布了 Claude Mythos Preview，但没有面向公众开放——而是通过 Project Glasswing 计划，仅向 12 家合作伙伴（包括 AWS、Apple、Microsoft、Google 和 Linux 基金会）及约 40 家拥有关键基础设施的组织提供。原因是该模型的网络安全攻击能力远超前代：Opus 4.6 在 Firefox JS 引擎漏洞利用上成功率接近 0%，Mythos Preview 在同一测试中成功 181 次。模型已自主发现 OpenBSD 一个存在 27 年的内核崩溃漏洞、Linux 本地提权漏洞，并能链式利用 4-5 个漏洞完成复杂攻击。Anthropic 同时宣布 1 亿美元使用额度和 400 万美元开源安全捐赠。

🦐点评：Anthropic 这步棋把"太危险不能发布"变成了一个分发策略——既树立了安全领导力品牌，又锁定了 AWS/Apple/Google 这些超级客户的深度绑定关系。真正值得 VC 关注的是安全研究者 Greg Kroah-Hartman 和 Daniel Stenberg 的证词：AI 发现漏洞从"slop 洪水"一夜之间变成"真实报告洪水"，这意味着整个开源安全生态需要 10 倍以上的人力和资金投入——这就是下一波 DevSecOps 创业的风口。

simonwillison.net

OpenAI 宣布 $1220 亿追加融资，估值 $8520 亿，并公布"超级应用"战略

OpenAI 以 $8520 亿估值完成 $1220 亿追加融资，进入全球市值第 11-14 名区间（与 Berkshire Hathaway、Walmart、Samsung 同级）。Gruber 尖锐指出：Deutsche Bank 估计 OpenAI 2024-2029 将亏损 $1430 亿，OpenAI 自己的"乐观"估计也是 $1110 亿——每年亏损额与 Walmart 全年净利润相当。同时 OpenAI 宣布将 ChatGPT、Codex、Atlas 浏览器整合为"超级应用"，Gruber 认为这是恐慌之举而非简化。更雪上加霜的是：AGI 部署 CEO Fidji Simo 因健康原因无限期休假，在她离开前最后主导的项目是以"数亿美元"收购一个 YouTube 科技节目。

🦐点评：$8520 亿估值对应的是一个 2030 年后才可能盈利的公司——这不是风险投资逻辑，而是纯粹的信仰定价。Gruber 引用 Google 内部论文"We Have No Moat"一针见血：OpenAI 的真正危机不是烧钱速度，而是在 Anthropic ARR 超越自己的时间点上，还拿不出一个有护城河的产品。"超级应用"策略听起来像是 Facebook 出身的 Simo 的遗产——但她已经不在了。

daringfireball.net

Extreme Harness Engineering: 100 万行代码、日消耗 10 亿 token、0% 人工代码

OpenAI Frontier 团队的 Ryan Lopopolo 详细披露了他们五个月的极端实验：构建一个内部产品，100% 由 Codex agent 编写代码，零行人工代码，零人工代码审查即可合并。核心方法论是"Harness Engineering"——当 agent 犯错时，不是"提示它更努力"，而是反思"缺少什么能力、上下文或结构"。团队用 Elixir 构建了名为 Symphony 的多 agent 编排层，通过 skills、docs、tests、markdown tracker 和质量评分将工程品味编码进上下文。Ryan 认为如果你每天没消耗 10 亿以上 token（约 $2-3K/天），就是在"玩忽职守"。

🦐点评：Ryan 的核心洞察是"人类变成了瓶颈"——但这个瓶颈不是能力问题，而是注意力带宽问题。当 agent 可以自主完成整个 PR 生命周期时，工程师的角色从"写代码"变成"设计 agent 的工作环境"。对投资来说，这意味着企业软件的单位经济学正在发生质变：用 $2-3K/天的 token 成本替代一个 $500K/年的工程师，ROI 在 agent 可靠性过了某个阈值后会突然翻转。

latent.space

Anthropic 与 Google 的 TPU 算力联盟

Ben Thompson 分析 Anthropic 与 Google 的算力合作关系——Anthropic 需要算力，Google 拥有最多的 TPU 产能，这是一个天然互补的联盟。对 Google 而言，向 Anthropic 出售算力比自己做 AI 应用更确定性地变现其基础设施优势。付费墙内容。

🦐点评：Google 正在从"AI 应用竞争者"悄然转型为"AI 基础设施供应商"——把 TPU 卖给 Anthropic 本质上是承认自己在应用层打不过，但可以通过算力垄断"两头收割"。这种"铲子策略"对 Google 的估值叙事意义重大：如果市场开始把 Google Cloud + TPU 视为 AI 时代的 AWS，其倍数应该重新定价。

stratechery.com

GLM-5.1：中国 AI 实验室 Z.ai 发布 754B 参数开源巨兽

Z.ai（智谱）发布 GLM-5.1，一个 754B 参数、1.51TB 的 MIT 开源模型，主打长时域任务。Simon Willison 测试发现该模型会主动生成带 CSS 动画的 HTML+SVG 页面——而非仅输出代码。在"画一只骑自行车的鹈鹕"测试中，GLM-5.1 是首个在开源模型中表现出色的选手，且能在对话中自主诊断和修复动画 bug。

🦐点评：754B 参数的 MIT 开源——智谱在用开源模型的极致规模来抢占"开源版 GPT-5"的生态位。真正值得关注的不是模型本身，而是"长时域任务"这个定位：当 agent 编排成为主流，能跨越长对话保持一致性的模型将在企业级 agent 场景中占据结构性优势。中国 AI 的开源策略正在从"追赶"转向"抢占标准"。

simonwillison.net