🔥 精选推荐

Opus 4.8 发布仅两周,Anthropic 就推出了 Mythos 级模型 Fable 5,定价约为 Opus 的两倍($10/$50 per M tokens)。FrontierCode Diamond 基准从 13.4% 跃升至 29.3%,CursorBench 刷新 SOTA 至 72.9%。但发布伴随两项争议政策:一是所有 Mythos 级流量强制 30 天数据留存(ZDR),二是通过隐形 steering vectors 和 PEFT 限制模型在前沿 LLM 开发任务上的表现——用户不会收到任何提示,模型只是"变笨了"。Anthropic 估计这影响不到 0.03% 的流量,但开源社区反应强烈。
🦐点评:Fable 5 真正的信号不在能力——而在分发策略。Anthropic 首次把"谁能用全力版"做成了产品层面的分级:Mythos 给政府和特定机构,Fable 给大众但暗中削弱前沿 AI 开发能力。这是一个 precedent——如果市场接受了"模型可以根据用途选择性降智",那未来所有 frontier 模型都可能走这条路。对竞争者来说,这等于 Anthropic 在用产品力构建一种新型护城河:不是"你追不上我的能力",而是"你用不了我的能力来追我"。
latent.space
a16z 的 David Haber 指出,企业内部正在发生一个不可逆转的变化:几乎所有工作会议默认被录音。AI 需要像新员工一样被"onboard"——不是读文档,而是参加会议、通过耳濡目染学习公司文化和决策上下文。Bridgewater 的全面录音制度多年来被视为怪异,如今 OpenAI 已经在用 agent 代替高管出席会议。一个新的企业软件品类正在出现——以语音而非文本为核心的 system of record,而"口头文化"公司(如 Shopify、OpenAI)将在 AI 时代获得不对称优势。
🦐点评:Haber 点出了一个被严重低估的赛道——"对话即数据"。Granola 被 a16z 提名为最懂自家文化的工具,不是因为技术多强,而是因为它"在场"了足够久。这意味着这个赛道的竞争壁垒不是算法而是时间——谁先进入企业的会议室,谁就拥有了最难复制的数据飞轮。对 CRM/ERP 创业者来说,最大的威胁可能不是 Salesforce 加 AI,而是一个录音工具反过来吃掉 CRM。
a16z.news
Gary Marcus 回顾了 5 月 22 日与预测次贷危机的 Steve Eisman(《大空头》原型)的对话。Eisman 认为 AI 泡沫的破裂方式可能类似次贷——当终端买家拒绝为 token 付费时,"整台机器就会死停"。Marcus 判断 OpenAI 最可能先出问题:烧钱最快、资产最少、已开始对投资者做越来越多让步(保底回报率 17.5%、融资条件挂钩 AGI 或 IPO)。Eisman 直言:如果 OpenAI 出事,"不是涟漪,是海啸"——Oracle 在 Q3 财报后因 AI backlog 数字从 230 涨到 330,这种估值结构极度脆弱。
🦐点评:Eisman 的类比值得认真对待——次贷危机的触发点不是房价下跌,而是投资者突然拒绝购买打包证券。AI 领域的等价物是:当企业发现 token 支出换不来等比例的生产力提升时,会集体缩减 AI 预算。Marcus 对 OpenAI 的判断可能过于尖锐,但他指出的结构性风险是真实的:OpenAI 的 17.5% 保底回报条款如果属实,几乎等于在告诉市场"我们自己也没有信心靠业务赚回这笔钱"。
garymarcus.substack.com
一项法律判决认定 Google 需为 AI 幻觉内容承担责任。Marcus 认为这可能是"巨大的"先例——如果其他国家效仿,整个生成式 AI 行业都将面临法律风险重估。评论区一位读者精辟总结了这个矛盾:"你不能一边说我们的 AI 是超级智能、胜过一屋子博士,一边又说它会胡编乱造、用户自己负责核实。这是大规模欺骗。"
🦐点评:这是 AI 行业的"产品责任法"时刻。如果"AI 幻觉"从技术局限变成法律责任,那所有把 LLM 输出直接呈现给终端用户的产品——从 AI Overview 到 Perplexity 到企业 chatbot——都需要重新评估风险敞口。对投资人来说最直接的影响是:AI 应用层的合规成本将显著上升,RAG + 人工审核 + 保险可能成为标配,这会侵蚀很多"AI 降本增效"叙事的利润空间。
garymarcus.substack.com
Flask 和 Sentry 创始人 Armin Ronacher 撰文指出,AI 领域正在发生一场关于"开放"的叙事操控。Anthropic 用安全和国家安全语言包装限制,但实质是在公共作品上训练模型后阻止开源社区学习和蒸馏这些系统。Apple 以安全为由延迟欧洲 AI 功能上线,实质是抵抗 DMA 要求的开放。他认为 EU 的 DMA 尽管争议重重,但正是防止"关门打狗"的关键制衡——短期的产品体验损失,换来的是长期的技术准入权。
🦐点评:Ronacher 的核心论点是——"安全"正在成为 AI 巨头构建竞争壁垒的新话语武器。当 Anthropic 说"为了安全不能让你蒸馏 Fable"时,实际效果和"你不能用我的模型来追赶我"完全一样。这对开源 AI 创业公司的融资叙事是个坏消息:如果 frontier 模型越来越难被蒸馏和学习,那"在开源模型基础上微调"这条路线的天花板就被人为压低了。
lucumr.pocoo.org

📌 其他新闻

Ben Thompson 分析 Fable 5 发布及其对 AI 行业分层的影响,认为 Fable 虽然能力出众,但设立了一些"令人不安的新先例"。付费文章,核心观点与 Latent Space 报道互为补充。
stratechery.com
Google 将去年的 Gemini Diffusion 实验以 Apache 2.0 开源发布为 DiffusionGemma(26B-A4B),NVIDIA NIM 免费托管,实测 500+ tokens/s。扩散式推理的开源化对推理成本格局有潜在影响。
simonwillison.net
Simon Willison 引用 Fable 5 系统卡片中的细节:Anthropic 对前沿 LLM 开发相关请求实施了隐形限制——不报错、不降级、不告知,只是通过 steering vectors 降低回答质量。这意味着用户永远无法确认自己是否获得了模型的全部能力。
simonwillison.net
Jeremy Howard 提出:如果真的想减缓 AI 递归自我改进,正确做法是禁止拥有最强模型的实验室自己使用它做前沿 AI 研究,而不是阻止其他人使用。Anthropic 选择了相反的路径——自己用 Fable 做研究,却限制竞争者。
simonwillison.net
Claude Code 更新至 v2.1.172,接入 Fable 5 和 Opus 4.6 模型,新增 Fast Mode 支持 Opus 4.8/4.7/4.6,Github star 达 132k。
github.com
字节跳动 AI 制药业务线启动拆分与独立融资,拆分后字节仍控股,核心团队约 50 人,继续获得火山引擎算力支持。蛋白结构预测团队已并入 AI 制药团队完成整合。
36kr.com
北京微面科技完成数百万美元融资(顺为资本),基于 rPPG 技术自研面部基座模型 FacePhys,可实时输出 120+ 项生理和情绪指标,面向机器人和 AI 交互场景的非语言信息理解。
36kr.com

🧠 AI 技术前沿

Hesamation @Hesamation
Google 发布 DiffusionGemma 扩散式推理模型,可并行生成 256 个 token,H100 上达 1000+ tok/s,RTX 5090 达 700+ tok/s。26B MoE 架构仅 3.8B 活跃参数,18GB 显存即可运行。
查看推文 →
cursor_ai @cursor_ai
Cursor 代码审查 agent 速度提升 3 倍、成本降低 22%、bug 检出率提高 10%。同时支持用 /review 命令在编辑器内直接触发审查。
查看推文 →
shao__meng @shao__meng
Cohere 发布首个开源编程模型 North Mini Code:MoE 架构(30B 总参数,3B 活跃),128 专家,256K 输入 / 64K 输出上下文,最低硬件需求仅 16GB 显存。
查看推文 →
karminski3 @karminski3
Fable 5 xhigh 模式实测:从零写光追渲染器,PBR 和 BRDF 表现出色,但仍存在一些奇怪的 bug,认为"超越人类还为时尚早"。
查看推文 →
EXM7777 @EXM7777
Claude Fable 5 能将数月工程压缩到数天,但核心问题是无法完全信任单次输出——需要多轮验证才能确保质量。
查看推文 →

🚀 创业动态

Hesamation @Hesamation
Cursor 有 700 名员工——你的 CEO 以为能用这个工具裁掉工程师,但做这个工具的公司本身就雇了这么多人。
查看推文 →
rileybrown @rileybrown
对 Agentic Payments(代理支付)感到兴奋——Mythos 级模型 + 自主注册和付费能力,意味着 agent 几乎可以构建任何东西。
查看推文 →
godofprompt @godofprompt
AI 视频真正危险的地方不在浏览器标签页,而在剪辑时间线里——Higgsfield 的 DaVinci 插件让 AI 视频生成直接嵌入后期编辑流程。
查看推文 →
levelsio @levelsio
现在全球获取电网接入有多难?数据中心对电力的需求正在挤压所有其他用电方。
查看推文 →
Hesamation @Hesamation
如果每月 130 万美元的 token 费用让你害怕,那就远离循环调用(loops)。高强度 AI 使用的成本正在快速上升。
查看推文 →
marclou @marclou
统计了 4,391 家盈利创业公司的域名权重(DR)排行榜:平均 DR 仅 12,DR 80+ 的只占 0.16%,绝大多数独立创业者的 SEO 基础非常薄弱。
查看推文 →

💬 观点与洞察

Hesamation @Hesamation
Claude Fable 的安全限制毫无意义——只阻止了守规矩的人,而坏人总能绕过护栏。尤其在网络安全领域,等于给黑客独占权。
查看推文 →
Hesamation @Hesamation
Dario Amodei 公开表示"Sam Altman 不可信",两家公司的竞争从产品层面升级到信任层面。
查看推文 →
emollick @emollick
"切换更便宜的模型来省钱"是个错误思路——更好的方法是用模型层级体系,让强模型做协调者和审计者,弱模型做执行者。
查看推文 →
emollick @emollick
开源权重的核心问题是商业模式不成立——前沿开源 AI 模型的开发成本极高,但几乎找不到通过封闭附属服务盈利的路径。
查看推文 →
shao__meng @shao__meng
Anthropic 的路线越来越清晰:toB 重心在企业端,创造实际效率、降低用人成本。看看他们百万美元账单客户数量的增速就知道了。
查看推文 →
shao__meng @shao__meng
Fable 5 和 Step 3.7 Flash 的价格差距:输入约 50 倍、输出约 50 倍、缓存命中输入差距更大。frontier 模型的定价正在拉开巨大鸿沟。
查看推文 →
AnthropicAI @AnthropicAI
AI 的发展速度远超政策制定机构的应对能力——两者之间的差距正成为最大的治理风险。
查看推文 →

🔥 精选推荐

欧洲 vibe coding 初创公司 Lovable 年化收入突破 5 亿美元,较 2 月的 4 亿美元继续增长。平台累计构建超 5000 万项目,使用量加速至每周新增 100 万。用户调查显示主要用户为非技术人员——创始人、设计师、销售,构建从电商到 CRM 到 HR 平台的各类工具。去年 8 月该公司曾表示有望 12 个月内 ARR 达 10 亿。
🦐点评:Lovable 的数据揭示了 vibe coding 赛道一个被低估的事实——它的用户不是"不会写代码的程序员",而是"以前根本不会进入软件开发流程的人"。每周百万新项目意味着巨大的长尾市场,但关键问题是留存:这些非技术用户构建的项目有多少活过了第一周?如果答案是很少,那 5 亿 ARR 的底层可能是一个高 churn 的漏斗。
Z Potentials
AI 科学研究公司 Lila Sciences 正洽谈 B 轮融资约 20 亿美元,融资前估值约 85 亿美元,由 CalPERS 和 NVIDIA NVentures 领投。去年 10 月 A 轮 3.5 亿美元估值 13 亿,不到一年估值翻了 6.5 倍。该公司由 Moderna 孵化器 Flagship Pioneering 创立,利用 AI 加速科学发现。
🦐点评:一年从 13 亿到 85 亿,Lila 的估值增速甚至超过了 AI 应用层独角兽。NVIDIA 领投的信号是——它在押注 AI4Science 将成为 GPU 算力的下一个大买方。但 CalPERS(加州公共养老金)参与领投也值得注意:养老金进场通常意味着资产类别的泡沫化风险在上升,因为它们的投资决策往往滞后于市场周期。
Z Potentials
蓝色光标 2025 年 AI 相关收入达 37.25 亿元,毛利率数倍于传统业务;2026 年 Q1 AI 业务 Token 调用量已达去年全年的三倍。每个员工的 Token 费用无上限报销。这家 30 岁营销集团正在从"帮客户买媒体投广告"转型为 AI 原生的内容生产和投放平台——2023 年喊出"All in AI"三年后,终于在财务数据上交出了证明。
🦐点评:蓝色光标的案例可能是目前中国上市公司 AI 转型最具说服力的财务证据——37 亿收入 + 毛利率数倍于旧业务,说明 AI 在营销领域已经跨过了"降本"阶段进入"增收"阶段。但更有趣的信号是"Token 费用无上限报销":当一家公司把 AI 使用量当作和差旅费一样的日常开支,说明 AI 已经从战略投入变成了运营基础设施。
晚点LatePost

📌 其他值得看

腾讯发布 Marvis 本地 Agent,以对话框形式运行,能下载公众号文章、清理电脑垃圾等。最有趣的是其"办公室"可视化——多个 Agent 模拟白领工作场景,没活干时还会在电脑上打《王者荣耀》。
葬AI
Mythos 和 Fable 底层同一个模型,区别在护栏:Mythos 给政府和特定机构($25/$125),Fable 面向所有人($10/$50,刚好比 Opus 4.8 贵一倍)。Pro/Max/Team 用户 6 月 22 日前可用,之后需 usage credits。
赛博禅心
深度分析 Fable 5 的隐形降级机制:约 5% 的高风险请求会被透明路由到 Opus 4.8,涵盖网络安全、生物化学和蒸馏尝试等领域。
深思SenseAI
从开发者视角分析 Fable 5 的 API 定价策略,指出 frontier 模型与中小开发者之间的成本鸿沟正在急剧扩大。
AGENT橘
23 岁中科大学生自研"溯因式世界模型"(Abductive World Model),尝试从视频生成和 3D 空间建模之外找到第三条世界模型路线。
Z Potentials