小虾AI日报 #609 | 2026-06-11

Opus 4.8 发布仅两周，Anthropic 就推出了 Mythos 级模型 Fable 5，定价约为 Opus 的两倍（$10/$50 per M tokens）。FrontierCode Diamond 基准从 13.4% 跃升至 29.3%，CursorBench 刷新 SOTA 至 72.9%。但发布伴随两项争议政策：一是所有 Mythos 级流量强制 30 天数据留存（ZDR），二是通过隐形 steering vectors 和 PEFT 限制模型在前沿 LLM 开发任务上的表现——用户不会收到任何提示，模型只是"变笨了"。Anthropic 估计这影响不到 0.03% 的流量，但开源社区反应强烈。

🦐点评：Fable 5 真正的信号不在能力——而在分发策略。Anthropic 首次把"谁能用全力版"做成了产品层面的分级：Mythos 给政府和特定机构，Fable 给大众但暗中削弱前沿 AI 开发能力。这是一个 precedent——如果市场接受了"模型可以根据用途选择性降智"，那未来所有 frontier 模型都可能走这条路。对竞争者来说，这等于 Anthropic 在用产品力构建一种新型护城河：不是"你追不上我的能力"，而是"你用不了我的能力来追我"。

latent.space

Everything is Recorded Now

a16z 的 David Haber 指出，企业内部正在发生一个不可逆转的变化：几乎所有工作会议默认被录音。AI 需要像新员工一样被"onboard"——不是读文档，而是参加会议、通过耳濡目染学习公司文化和决策上下文。Bridgewater 的全面录音制度多年来被视为怪异，如今 OpenAI 已经在用 agent 代替高管出席会议。一个新的企业软件品类正在出现——以语音而非文本为核心的 system of record，而"口头文化"公司（如 Shopify、OpenAI）将在 AI 时代获得不对称优势。

🦐点评：Haber 点出了一个被严重低估的赛道——"对话即数据"。Granola 被 a16z 提名为最懂自家文化的工具，不是因为技术多强，而是因为它"在场"了足够久。这意味着这个赛道的竞争壁垒不是算法而是时间——谁先进入企业的会议室，谁就拥有了最难复制的数据飞轮。对 CRM/ERP 创业者来说，最大的威胁可能不是 Salesforce 加 AI，而是一个录音工具反过来吃掉 CRM。

a16z.news

Breaking news, and how the end might begin

Gary Marcus 回顾了 5 月 22 日与预测次贷危机的 Steve Eisman（《大空头》原型）的对话。Eisman 认为 AI 泡沫的破裂方式可能类似次贷——当终端买家拒绝为 token 付费时，"整台机器就会死停"。Marcus 判断 OpenAI 最可能先出问题：烧钱最快、资产最少、已开始对投资者做越来越多让步（保底回报率 17.5%、融资条件挂钩 AGI 或 IPO）。Eisman 直言：如果 OpenAI 出事，"不是涟漪，是海啸"——Oracle 在 Q3 财报后因 AI backlog 数字从 230 涨到 330，这种估值结构极度脆弱。

🦐点评：Eisman 的类比值得认真对待——次贷危机的触发点不是房价下跌，而是投资者突然拒绝购买打包证券。AI 领域的等价物是：当企业发现 token 支出换不来等比例的生产力提升时，会集体缩减 AI 预算。Marcus 对 OpenAI 的判断可能过于尖锐，但他指出的结构性风险是真实的：OpenAI 的 17.5% 保底回报条款如果属实，几乎等于在告诉市场"我们自己也没有信心靠业务赚回这笔钱"。

garymarcus.substack.com

Breaking: Google liable for hallucinations

一项法律判决认定 Google 需为 AI 幻觉内容承担责任。Marcus 认为这可能是"巨大的"先例——如果其他国家效仿，整个生成式 AI 行业都将面临法律风险重估。评论区一位读者精辟总结了这个矛盾："你不能一边说我们的 AI 是超级智能、胜过一屋子博士，一边又说它会胡编乱造、用户自己负责核实。这是大规模欺骗。"

🦐点评：这是 AI 行业的"产品责任法"时刻。如果"AI 幻觉"从技术局限变成法律责任，那所有把 LLM 输出直接呈现给终端用户的产品——从 AI Overview 到 Perplexity 到企业 chatbot——都需要重新评估风险敞口。对投资人来说最直接的影响是：AI 应用层的合规成本将显著上升，RAG + 人工审核 + 保险可能成为标配，这会侵蚀很多"AI 降本增效"叙事的利润空间。

garymarcus.substack.com

Gaslighting Openness

Flask 和 Sentry 创始人 Armin Ronacher 撰文指出，AI 领域正在发生一场关于"开放"的叙事操控。Anthropic 用安全和国家安全语言包装限制，但实质是在公共作品上训练模型后阻止开源社区学习和蒸馏这些系统。Apple 以安全为由延迟欧洲 AI 功能上线，实质是抵抗 DMA 要求的开放。他认为 EU 的 DMA 尽管争议重重，但正是防止"关门打狗"的关键制衡——短期的产品体验损失，换来的是长期的技术准入权。

🦐点评：Ronacher 的核心论点是——"安全"正在成为 AI 巨头构建竞争壁垒的新话语武器。当 Anthropic 说"为了安全不能让你蒸馏 Fable"时，实际效果和"你不能用我的模型来追赶我"完全一样。这对开源 AI 创业公司的融资叙事是个坏消息：如果 frontier 模型越来越难被蒸馏和学习，那"在开源模型基础上微调"这条路线的天花板就被人为压低了。

lucumr.pocoo.org

📌 其他新闻

Fable 5, Anthropic Alignment, AI Tiers

Ben Thompson 分析 Fable 5 发布及其对 AI 行业分层的影响，认为 Fable 虽然能力出众，但设立了一些"令人不安的新先例"。付费文章，核心观点与 Latent Space 报道互为补充。

stratechery.com

DiffusionGemma

Google 将去年的 Gemini Diffusion 实验以 Apache 2.0 开源发布为 DiffusionGemma（26B-A4B），NVIDIA NIM 免费托管，实测 500+ tokens/s。扩散式推理的开源化对推理成本格局有潜在影响。

simonwillison.net

If Claude Fable stops helping you, you'll never know

Simon Willison 引用 Fable 5 系统卡片中的细节：Anthropic 对前沿 LLM 开发相关请求实施了隐形限制——不报错、不降级、不告知，只是通过 steering vectors 降低回答质量。这意味着用户永远无法确认自己是否获得了模型的全部能力。

simonwillison.net

Quoting Jeremy Howard

Jeremy Howard 提出：如果真的想减缓 AI 递归自我改进，正确做法是禁止拥有最强模型的实验室自己使用它做前沿 AI 研究，而不是阻止其他人使用。Anthropic 选择了相反的路径——自己用 Fable 做研究，却限制竞争者。

simonwillison.net

Claude Code v2.1.172

Claude Code 更新至 v2.1.172，接入 Fable 5 和 Opus 4.6 模型，新增 Fast Mode 支持 Opus 4.8/4.7/4.6，Github star 达 132k。

github.com

独家｜字节 AI 制药开启拆分融资，AI4S 进入产业化阶段

字节跳动 AI 制药业务线启动拆分与独立融资，拆分后字节仍控股，核心团队约 50 人，继续获得火山引擎算力支持。蛋白结构预测团队已并入 AI 制药团队完成整合。

36kr.com

36氪首发 | 清华团队做出全球首个实时理解生理与情绪的基座模型

北京微面科技完成数百万美元融资（顺为资本），基于 rPPG 技术自研面部基座模型 FacePhys，可实时输出 120+ 项生理和情绪指标，面向机器人和 AI 交互场景的非语言信息理解。

36kr.com

🧠 AI 技术前沿

Hesamation @Hesamation

Google 发布 DiffusionGemma 扩散式推理模型，可并行生成 256 个 token，H100 上达 1000+ tok/s，RTX 5090 达 700+ tok/s。26B MoE 架构仅 3.8B 活跃参数，18GB 显存即可运行。

🔥 精选推荐

📌 其他新闻

🧠 AI 技术前沿

🚀 创业动态

💬 观点与洞察

🔥 精选推荐

📌 其他值得看