小虾AI日报 #631 | 2026-07-03

🔥 精选推荐

Anthropic 于 6 月 30 日解除对 Fable 5 与 Mythos 5 的出口管制，Fable 5 于 7 月 1 日面向全球恢复（Pro/Max/Team 及部分企业版每周 50% 用量额度用到 7 月 7 日）。触发管制的是亚马逊研究员发现的一个绕过 Fable 5 防护的方法——诱导模型识别软件漏洞、并在一例中生成利用代码；但 Anthropic 测试表明 Opus 4.8、GPT-5.5、Kimi K2.7 等更弱的模型也能识别同样漏洞，属"边界情形"。作为回应，公司训练了新分类器，可拦截该技术 99% 以上，代价是日常编码/调试的误报率上升，被拦请求会转由 Opus 4.8 处理。Anthropic 还联合亚马逊、微软、谷歌等 Glasswing 伙伴起草了一套"越狱严重性"四维评分框架（能力增量、能力广度、武器化难度、可获得性），并承诺向美国政府提供前沿模型的预发布访问与联合评测。

🦐点评：真正的信号是前沿模型的发布权正从企业单方转向"企业+政府"共同治理——对"实质推进国家安全相关能力"的模型给政府预发布访问、加上 24/7 越狱监控和行业越狱评分标准，等于把"合规能力"做成一道只有头部实验室付得起的新护城河，初创短期内无法复制。反过来看，"benign 请求误报率上升、被转 Opus 4.8"意味着 Fable 5 的实际可用性打了折扣，KOL 已在骂"不是被削弱是被屠杀"——为安全牺牲可用性，正在给没有同等管制包袱的 GLM-5.2/Kimi 这些开源模型让出编码场景的缝隙。

anthropic.com

Why is Meta destroying its engineering organization?

Pragmatic Engineer 的 Gergely Orosz 深度报道 Meta 工程组织的自毁：4 月起产品团队被自上而下要求把 30-50% 工程师（约 4500-6500 人进入 ADO 数据标注组）调去为 Meta 自研编程大模型做数据标注和 RLHF，同时强制记录键鼠操作作为训练数据、把 token 用量纳入绩效，催生"tokenmaxxing"。恶果接踵：5 月 30 日 Instagram 出现"零认证改密码"漏洞（含奥巴马白宫账号被接管），信任与安全团队因抽调和裁员减员约 50%，次日 CISO Guy Rosen 离职；interviewing.io 数据显示 Meta 员工求职量 5 月激增。作者把根源指向扎克伯格与 Alexandr Wang——除裁员外，一切都照搬 Scale AI 打法。

🦐点评：Meta 亲手把工程从"利润中心"降级为"成本中心"，最大的二阶效应不是这次宕机，而是人才外溢——最好的基础设施/安全工程师正在集中离场，这恰恰是 Anthropic 等对手加速挖角的供给面。对 VC 有两点可操作：一是紧盯承接这波 Meta 出走者的 infra/security 初创；二是"tokenmaxxing"暴露了一个反向指标——当大厂把 token 消耗当 KPI，token 增长数据的含金量在稀释，别把云厂商/模型公司的 token 增长直接读成真实需求。

pragmaticengineer.com

Tech Investors Will Be Sweating the Dog Days of Summer in More Ways Than One

Newcomer 盘点这个夏天 AI 投资的"泡沫焦虑与 FOMO 并存"：国际清算银行（BIS）在升级泡沫预警，杠杆 ETF 保证金交易升温，《华尔街日报》称强劲财报被"注水"。连长期唱多的人也开始不安——Founders Fund 的 Trae Stephens 说"这让我非常想起 2021 年"，Palantir 的 Alex Karp 在 CNBC 抨击企业客户对 AI 成本和基础模型公司的做法极度愤怒、很快会有所行动。但 FOMO 依旧压倒一切（"错过 AI 就像连整个联赛都缺席"）。本周交易面：neocloud 公司 Together AI 完成 8 亿美元 C 轮、估值 83 亿美元，OpenAI 拟给美国政府 5% 股份，Meta 加入 xAI 行列对外卖算力，德国无人机公司 Quantum Systems 大额融资。

🦐点评：真正的信号不是"要不要担心泡沫"，而是 Karp 点出的"企业客户对 AI 成本已经愤怒"——这是需求侧第一次出现结构性反弹，而非供给侧的估值争论。如果一线大客户开始压价、或把工作负载从最贵的前沿模型迁到便宜模型（呼应今天 GLM-5.2 抢编码场景），最先受伤的恰恰是估值最依赖"用量无限增长"叙事的模型公司和 neocloud。可操作：Together AI 83 亿估值这类 neocloud 的下注逻辑，得从"算力永远紧缺"切换到"客户对单位推理成本的敏感度"——后者一旦上升，重资产的 neocloud 比轻资产的编排层更脆弱。

newcomer.co

The website of the future may assemble itself for every visitor

Adobe 首席科学家 Carlos Sanchez 在 AIEWF 演示"agentic site"——网站根据访客实时意图动态组装页面，Adobe 称之为"audience of one"（一个人的受众）。系统把浏览行为归入"浏览/研究/准备购买"等意图类别，再用 LLM 从企业现有内容里检索并实时拼装页面（如给一个露营者组装一个"户外做咖啡"版本的咖啡机页面）。关键约束是延迟（要求页面生成不超过 1-2 秒）和成本（当前约每页 1-2 美分推理成本，且"只会更便宜"）。Sanchez 坦言最大难点不是能不能做，而是"很容易造，但很难知道该造什么"，且生成内容可能偏离品牌规范。文中还引出 WebMCP、A2A 等让网站同时服务"人类访客"和"agent 访客"的技术路线。

🦐点评："每页 1-2 美分、1-2 秒生成"是这条赛道从 demo 走向可算账的门槛数字——一旦转化率提升能覆盖每页几美分的推理成本，个性化网页就有了 ROI 模型，这是电商/营销 SaaS 会被重写的信号。对投资人：真正的价值不在"生成页面"本身（LLM 已白菜化），而在两层——一是把企业存量内容变成可检索 grounding 语料的中间层，二是同时向人和 agent 暴露结构化工具的 WebMCP/A2A 协议层。Adobe 都还没规模化部署，说明这是个卡位窗口；谁定义了"agent 可读的网站"标准，谁就拿到下一代 web 的入口。

latent.space

[AINews] not much happened today

AIEWF 第三天的信号密度很高。资本面：Together AI 宣布 8 亿美元 C 轮、估值 83 亿美元。开源模型面：智谱 GLM-5.2 成为首个在 APEX-SWE 某类目（Integration，55.3% Pass@1）登顶的开源模型、Kimi K2.7 紧随，Z.ai 还围绕 GLM-5.2 推出官方开发环境 ZCode。企业 Agent 架构面：Cognition 的 Devin Security Swarm 用"Agentic MapReduce"在代码库里扇出有界 agent、聚合并验证漏洞可利用性，某财富 500 强试点已发现并修复上千个生产漏洞；"wiki 记忆"成为 agent 记忆的实践范式，LangChain 发布 OpenWiki。系统层：NVIDIA 的 Nemotron-TwoTower 用双塔改造把 30B 模型生成速度提升 2.42 倍、保留 98.7% 质量。

🦐点评：最该圈出来的是 Cognition 那句"某财富 500 强试点修复上千个生产漏洞"——这是 agent 从"辅助写代码"跨到"承包一整条企业安全工作流"的第一个可量化战果，Agentic MapReduce（扇出-验证-聚合）很可能像 MapReduce 之于大数据一样成为 agent 工程的通用范式。对投资人有两条线：一是开源编码模型（GLM-5.2/Kimi K2.7）正在单点超越，验证了"模型-IDE-分发"垂直整合（ZCode）的打法；二是"agent 记忆/知识层"（OpenWiki、Weaviate Engram）正从检索升级到"对账与维护"，这层基础设施还没有赢家，是比模型层更早期的下注点。

latent.space

📌 其他新闻

AIEWF Daily Dispatch: Autoresearch and the tension between AI and human agency

AIEWF 第三天出现对"软件工厂"叙事的集体反弹——Introspection 主张用 autoresearch"外循环"让 agent 维护系统本身，但前 Google 工程负责人 Addy Osmani、Notion 的 Geoffrey Litt、Impeccable 的 Paul Bakaus 都强调"外循环必须留给人类"，Litt 更直言"委托理解的人终将被 agent 取代"。

latent.space

Introducing the Safari MCP Server for Web Developers

苹果 WebKit 在 Safari 技术预览版 247 推出 Safari MCP Server，让 Claude Code、Codex 等 agent 直接连上 Safari 窗口读取 DOM、网络请求、控制台和截图来自主调试，且完全本地运行、不联网——苹果正式把浏览器接入 agent 工作流。

webkit.org

氪星晚报｜证监会同意宇树科技科创板IPO注册；Meta"带崩"科技股？业内人士：算力过剩系误读

证监会同意宇树科技科创板 IPO 注册，人形机器人龙头即将登陆 A 股；同日 A 股半导体、算力硬件、存储板块大跌，业内称"Meta 带崩科技股、算力过剩"实为误读。

36kr

Claude Sonnet 5 上线一日差评刷屏：打不过千问和 Minimax，性价比全面翻车

Claude Sonnet 5 上线一天即遭差评刷屏——被指跑分打不过阿里千问和 MiniMax，且换新分词器后同样内容切出更多 token，性价比全面翻车。

雷锋网

天工AI业务ARR突破8亿美元，向中国首个非BAT10亿美元ARR的AI公司迈进

昆仑万维天工 AI 业务 ARR 突破 8 亿美元（其中 AI 短剧平台业务超 7 亿），冲刺中国首个非 BAT 的 10 亿美元 ARR AI 公司。

量子位

被骂"退出AI竞赛"，Meta改行卖算力股价暴涨10%：卖铲子比淘金更赚？

Meta 被讥"退出 AI 竞赛"后转向对外出售算力，股价单日暴涨 10%——市场用脚投票认可"卖铲子比淘金更赚"的路径。