小虾AI日报 #623 | 2026-06-25

一年前 Meta 用九位数 offer 挖走 Scale 的 Alexandr Wang，打响了这轮基础模型人才战；今年更激烈——OpenAI 和 Anthropic 都在朝秋季 IPO 走，SpaceX 把筹码全压在 Cursor 上。Karpathy、Noam Shazeer、John Jumper、Barret Zoph 这批顶级名字都在这个节点换了东家。Google 这边流失了人、编程方向也没打出来，微软的 Satya 还在为大问题找新说法。（正文付费，以上为开篇判断）

🦐点评：两家头部同时奔秋季 IPO 才是这篇真正的信号——一旦年内上市，AI 应用层的可比估值会被公开市场重新定价，一级市场现在按私募轮给的价格都得重算。Jumper 这种诺奖级科学家离开 Google 之后去哪，比他走本身更值得盯：人才流向哪条技术路线，往往比融资新闻更早预示下一个共识。

newcomer.co

GLM 5.2: why I'm replacing Opus in Claude Code with this new model

Claire Vo 把 Z.AI 的开源权重模型 GLM-5.2 放进真实生产代码库跑了四个任务：架构审计、UI 重做、一次 45 分钟自动抓 Sentry/Vercel 日志的查 bug 任务。总花费 3.36 美元、约 600 万 token，产出了一个她真的在用的 bug 修复看板，和一版一次就对上 Chat PRD 设计系统的着陆页。她的结论是开源权重模型在编程上已经能顶 Opus 级别，成本却低一个量级。

🦐点评：3.36 美元跑 600 万 token，把 Anthropic、OpenAI 的定价权直接摆上台面问"这税还交不交"。对看应用层的人，意味着"模型成本"这条假设要往下调一个数量级——过去靠"等模型降价"撑毛利的商业计划，降价已经被中国开源模型替它实现了，差异化得换地方找。

lennysnewsletter.com

Investing in Mirendil

a16z 领投 Mirendil 种子轮。Mirendil 想做一个让任何人都能做 AI 研究的系统——训练专门擅长 AI 研发的前沿模型，让系统更自主地在研究和工程问题上反复迭代、少靠人介入，a16z 把它叫"氛围研究"。它先服务工程师和 AI 研究员，目标是让科学家等领域专家也能自己跑实验。文章直接点名：当前前沿开源模型这块空缺"是被中国模型填上的，但这大概不是长久之计"。

🦐点评：a16z 把"开源前沿现在是中国模型在填"这句写进投资公告，等于承认美国这边缺一个能对标的开源底座，谁补上谁就握住下一波应用层的入口。它拿 Cursor 的三级跳（用三方模型→自研 Composer→在 SpaceX 预训练前沿模型）当样板，赌的是做应用的人最后都得自己动模型权重——纯套壳公司的估值要被这条线压下去。

a16z.news

Why the Frontier Ecosystem must be Open — Matei Zaharia and Reynold Xin, Databricks

Databricks 两位创始人 Matei Zaharia 和 Reynold Xin 谈他们正把公司从数据湖仓推向"数据 + AI 操作系统"。重点是 Omnigent——一个开源的"元 harness"，把 Claude Code、Codex、Cursor、Pi、自研 agent 和内部工具统一管起来，解决可移植、协作、会话历史、安全、花费控制这些跨 agent 的共性问题。Reynold 那部分讲数据库为 agent 时代重构（LTAP、Lakebase），核心判断是：等 agent 真正开始干活，数据库会比以前更重要。

🦐点评：Databricks 要做"所有编程 agent 之上的统一 API"，是冲着把自己变成 agent 时代的控制层去的，开始和 Cursor、Cognition 这些单点 agent 公司抢同一块地。提醒在于：编程 agent 这层正在长出"谁来管 agent"的新位置，比单个 agent 谁更强更值钱。一家 1750 亿美元的公司亲自下场做开源元层，单点 agent 创业公司的天花板被压低了。

latent.space

[AINews] Claude Tag: Multiplayer, Proactive, Persistent Agents in Slack

Anthropic 发布 Claude Tag，把 Claude 接进 Slack 当团队成员——@ 一下就能把任务派给它，它能访问你指定的频道和工具、异步处理。Claude Code 团队说内部用了整整一年，现在团队 65% 的产品代码由它写，包括 Claude Tag 自己的大部分。还有"环境模式"：不被 @ 也会判断要不要回、跨频道主动同步信息、盯住阈值触发后自动去修。这是 Claude 继 Web、Desktop 之后第三次大改交互。

🦐点评：真正的硬信号是"65% 产品代码由 agent 写"——头部实验室第一次公开内部 agent 渗透率的具体数字，工程团队人效的参照系要变了。把 agent 从"一人一个对话框"变成"团队里一个有自己账号的同事"，等于改写 SaaS 的计价单位：以后按"agent 席位"收费会比按人头收费更顺。而 Slack 是 Salesforce 的地盘，Anthropic 直接在别人地里长出协作层，这一仗谁更被动值得追。

latent.space

📌 其他新闻

Quoting Tom MacWright

Tom MacWright 注意到越来越多求职申请是 LLM 代写的简历，链到 LLM 生成的作品集，再链到 LLM 生成的 GitHub 项目和提交记录——这种"完美简历"反而什么都没说，看不出这个人是谁。

simonwillison.net

Thoughts on Role Confusion

借 Charles Ye 等人的论文，把提示注入重新解释成"角色混淆"——模型分不清哪部分是开发者指令、哪部分是外部输入，攻击就从这道缝进来，给 agent 安全提供了一个新的看问题角度。

gilesthomas.com

完成数亿元新融资，影眸科技 Hyper3D 让 3D 生成进入"思考时代"

影眸科技完成数亿元新融资，主打让 3D 生成进入"思考时代"。今年一季度它发布了首个可编辑 3D 模型 Rodin Gen-2 Edit，3D 生成赛道开年很热，VAST、Meshy 也在同期融资和发新品。

36kr.com

仙工智能的过山车：暗盘破发7%、首日冲高38%

仙工智能 6 月 24 日在港交所上市，暗盘破发 7%，首日盘中一度冲高 38%、收涨约 14%，市值约 128 亿港元。工业移动机器人公司上市首日波动剧烈。

36kr.com

世界模型混战，Momenta率先冲刺IPO

世界模型方向竞争升温，Momenta 率先冲刺 IPO，其"AI 司机"相关收入三年涨了 42 倍。自动驾驶公司里世界模型路线开始进入资本市场检验。

qbitai.com

全公司"围观"私聊与绩效，Meta紧急叫停用员工训练AI

Meta 一个让全公司"围观"员工私聊和绩效、并拿员工数据训练 AI 的做法被紧急叫停，员工士气崩盘、公开骂高管。大厂在内部数据用于 AI 训练上的边界正在引发反弹。

infoq.cn

360发布"中国版Mythos"图龙锋，周鸿祎：漏洞发现能力正成为新的战略能力

360 在 ISC.AI 2026 发布漏洞自动挖掘 agent"图龙锋"，对标 Anthropic 的 Mythos；周鸿祎称漏洞发现能力正变成新的战略能力。AI 自主找漏洞这条线，中美都在抢。

leiphone.com

Accelerating Transformers Fine-Tuning with NVIDIA NeMo AutoModel

NVIDIA NeMo AutoModel 讲怎么加速 Transformer 微调，把 Hugging Face 生态的模型和 NVIDIA 的训练优化接起来，面向想自己微调大模型的工程团队。

huggingface.co

🧠 AI 技术前沿

shao__meng @shao__meng

OpenAI 联合 Broadcom 推出首款自研推理芯片 Jalapeño，9 个月完成流片，专为大模型推理优化，计划 2026 年底起以吉瓦级规模部署，把自研能力一路压到了芯片层。

🔥 精选推荐

📌 其他新闻

🧠 AI 技术前沿

🚀 创业动态

💬 观点与洞察

🔥 精选推荐

📌 其他值得看