🔥 精选推荐

一年前 Meta 用九位数 offer 挖走 Scale 的 Alexandr Wang,打响了这轮基础模型人才战;今年更激烈——OpenAI 和 Anthropic 都在朝秋季 IPO 走,SpaceX 把筹码全压在 Cursor 上。Karpathy、Noam Shazeer、John Jumper、Barret Zoph 这批顶级名字都在这个节点换了东家。Google 这边流失了人、编程方向也没打出来,微软的 Satya 还在为大问题找新说法。(正文付费,以上为开篇判断)
🦐点评:两家头部同时奔秋季 IPO 才是这篇真正的信号——一旦年内上市,AI 应用层的可比估值会被公开市场重新定价,一级市场现在按私募轮给的价格都得重算。Jumper 这种诺奖级科学家离开 Google 之后去哪,比他走本身更值得盯:人才流向哪条技术路线,往往比融资新闻更早预示下一个共识。
newcomer.co
Claire Vo 把 Z.AI 的开源权重模型 GLM-5.2 放进真实生产代码库跑了四个任务:架构审计、UI 重做、一次 45 分钟自动抓 Sentry/Vercel 日志的查 bug 任务。总花费 3.36 美元、约 600 万 token,产出了一个她真的在用的 bug 修复看板,和一版一次就对上 Chat PRD 设计系统的着陆页。她的结论是开源权重模型在编程上已经能顶 Opus 级别,成本却低一个量级。
🦐点评:3.36 美元跑 600 万 token,把 Anthropic、OpenAI 的定价权直接摆上台面问"这税还交不交"。对看应用层的人,意味着"模型成本"这条假设要往下调一个数量级——过去靠"等模型降价"撑毛利的商业计划,降价已经被中国开源模型替它实现了,差异化得换地方找。
lennysnewsletter.com
a16z 领投 Mirendil 种子轮。Mirendil 想做一个让任何人都能做 AI 研究的系统——训练专门擅长 AI 研发的前沿模型,让系统更自主地在研究和工程问题上反复迭代、少靠人介入,a16z 把它叫"氛围研究"。它先服务工程师和 AI 研究员,目标是让科学家等领域专家也能自己跑实验。文章直接点名:当前前沿开源模型这块空缺"是被中国模型填上的,但这大概不是长久之计"。
🦐点评:a16z 把"开源前沿现在是中国模型在填"这句写进投资公告,等于承认美国这边缺一个能对标的开源底座,谁补上谁就握住下一波应用层的入口。它拿 Cursor 的三级跳(用三方模型→自研 Composer→在 SpaceX 预训练前沿模型)当样板,赌的是做应用的人最后都得自己动模型权重——纯套壳公司的估值要被这条线压下去。
a16z.news
Databricks 两位创始人 Matei Zaharia 和 Reynold Xin 谈他们正把公司从数据湖仓推向"数据 + AI 操作系统"。重点是 Omnigent——一个开源的"元 harness",把 Claude Code、Codex、Cursor、Pi、自研 agent 和内部工具统一管起来,解决可移植、协作、会话历史、安全、花费控制这些跨 agent 的共性问题。Reynold 那部分讲数据库为 agent 时代重构(LTAP、Lakebase),核心判断是:等 agent 真正开始干活,数据库会比以前更重要。
🦐点评:Databricks 要做"所有编程 agent 之上的统一 API",是冲着把自己变成 agent 时代的控制层去的,开始和 Cursor、Cognition 这些单点 agent 公司抢同一块地。提醒在于:编程 agent 这层正在长出"谁来管 agent"的新位置,比单个 agent 谁更强更值钱。一家 1750 亿美元的公司亲自下场做开源元层,单点 agent 创业公司的天花板被压低了。
latent.space
Anthropic 发布 Claude Tag,把 Claude 接进 Slack 当团队成员——@ 一下就能把任务派给它,它能访问你指定的频道和工具、异步处理。Claude Code 团队说内部用了整整一年,现在团队 65% 的产品代码由它写,包括 Claude Tag 自己的大部分。还有"环境模式":不被 @ 也会判断要不要回、跨频道主动同步信息、盯住阈值触发后自动去修。这是 Claude 继 Web、Desktop 之后第三次大改交互。
🦐点评:真正的硬信号是"65% 产品代码由 agent 写"——头部实验室第一次公开内部 agent 渗透率的具体数字,工程团队人效的参照系要变了。把 agent 从"一人一个对话框"变成"团队里一个有自己账号的同事",等于改写 SaaS 的计价单位:以后按"agent 席位"收费会比按人头收费更顺。而 Slack 是 Salesforce 的地盘,Anthropic 直接在别人地里长出协作层,这一仗谁更被动值得追。
latent.space

📌 其他新闻

Tom MacWright 注意到越来越多求职申请是 LLM 代写的简历,链到 LLM 生成的作品集,再链到 LLM 生成的 GitHub 项目和提交记录——这种"完美简历"反而什么都没说,看不出这个人是谁。
simonwillison.net
借 Charles Ye 等人的论文,把提示注入重新解释成"角色混淆"——模型分不清哪部分是开发者指令、哪部分是外部输入,攻击就从这道缝进来,给 agent 安全提供了一个新的看问题角度。
gilesthomas.com
影眸科技完成数亿元新融资,主打让 3D 生成进入"思考时代"。今年一季度它发布了首个可编辑 3D 模型 Rodin Gen-2 Edit,3D 生成赛道开年很热,VAST、Meshy 也在同期融资和发新品。
36kr.com
仙工智能 6 月 24 日在港交所上市,暗盘破发 7%,首日盘中一度冲高 38%、收涨约 14%,市值约 128 亿港元。工业移动机器人公司上市首日波动剧烈。
36kr.com
世界模型方向竞争升温,Momenta 率先冲刺 IPO,其"AI 司机"相关收入三年涨了 42 倍。自动驾驶公司里世界模型路线开始进入资本市场检验。
qbitai.com
Meta 一个让全公司"围观"员工私聊和绩效、并拿员工数据训练 AI 的做法被紧急叫停,员工士气崩盘、公开骂高管。大厂在内部数据用于 AI 训练上的边界正在引发反弹。
infoq.cn
360 在 ISC.AI 2026 发布漏洞自动挖掘 agent"图龙锋",对标 Anthropic 的 Mythos;周鸿祎称漏洞发现能力正变成新的战略能力。AI 自主找漏洞这条线,中美都在抢。
leiphone.com
NVIDIA NeMo AutoModel 讲怎么加速 Transformer 微调,把 Hugging Face 生态的模型和 NVIDIA 的训练优化接起来,面向想自己微调大模型的工程团队。
huggingface.co

🧠 AI 技术前沿

shao__meng @shao__meng
OpenAI 联合 Broadcom 推出首款自研推理芯片 Jalapeño,9 个月完成流片,专为大模型推理优化,计划 2026 年底起以吉瓦级规模部署,把自研能力一路压到了芯片层。
查看推文 →
Hesamation @Hesamation
Google 麻烦不小:DeepMind 两位资深研究员 Jonas Adler、Alexander Pritzel 据传将离职,紧接着此前 John Jumper(AlphaFold 诺奖得主)和 Noam Shazeer 已出走,而 Gemini 3.5 Pro 预计不会是颠覆之作。
查看推文 →
emollick @emollick
Gemini 3 Pro 在 2025 年 11 月成为首个 ARC-AGI-2 得分至少 23%(实际 31%)的模型,开源与闭源之间 8-12 个月的差距看起来仍然成立,但模型能力越来越参差,有些任务强、有些任务弱。
查看推文 →
karminski3 @karminski3
认为智谱市值破万亿不算高估——它在 GLM 的 agent 能力训练上确实领先。用模拟送外卖的 silicon-rider-bench 测了 30 个国产模型,GLM-5 到 5.2 明显分三段进化:先会反思自己行为、再会自己规划送顺路单、效率越来越高。
查看推文 →
_akhaliq @_akhaliq
阿里推出 Qwen-AgentWorld,一个面向通用 agent 的"语言世界模型",把世界模型的思路用到 agent 上。
查看推文 →
shao__meng @shao__meng
用 TRAE Work 测了字节豆包 2.1 Pro:视觉还原、前端设计和交互上超出预期,能从一张设计图理解布局和细节再实现;官方称其 Coding/Agent 能力介于 Claude Opus 4.6 和 4.8 之间。
查看推文 →
Hesamation @Hesamation
传 Anthropic 的 Fable 5 即将回归,而且可能直接包含在订阅里。
查看推文 →

🚀 创业动态

cursor_ai @cursor_ai
现在可以直接从 Notion 把任务派给 Cursor,基于 Cursor SDK,每个云端 agent 跑的都是和 Cursor 一样的模型、harness 和运行环境,能针对某份文档或任务直接开 PR 供团队审。
查看推文 →
egeberkina @egeberkina
原以为"氛围导演"只是营销话术,自己做了一部短片才改观——整部片子来自一次对话,不用拼片、切工具或为角色一致性反复重生成;OpenArt 把这定义成新品类。
查看推文 →
shao__meng @shao__meng
Google Workspace CLI 开源两个月后,原作者 JPoehnelt 被 Google 解雇,原因含糊:可能是 repo 用了官方标志,也可能和 Google Cloud Next 官方版 Workspace CLI 撞了方向或提前剧透,作者自己也没说清。
查看推文 →
vasuman @vasuman
企业 AI 失败不是因为模型不够好,而是把好模型对准了坏流程。难的从来不是造 agent,而是判断哪些用确定性规则自动化、哪些交给 agent、哪些留给人——这是流程工程问题,做对了同一个模型能强 100 倍。
查看推文 →

💬 观点与洞察

gregisenberg @gregisenberg
未来的工作是每个人都有自己的 AI 员工,有独立邮箱、Slack 账号和团队席位。有了 Claude Tag 这类工具,agent 是你"@ 一下并交办"的对象,像对同事一样委派,它有自己的历史记录,干好干砸都能追责。
查看推文 →
corbin_braun @corbin_braun
预测 AI 时代网红的走向:卖自己的肖像 → 填一份兴趣表 → 拍一组本人形象 → 录 2 小时发音锁声线 → 上传过往内容,全部训练进一个专属形象,之后由它持续产出。
查看推文 →
emollick @emollick
怎么在组织里用 AI,正越来越变成组织设计和战略问题,而不是 IT 选型:怎么把 agent 编进公司、哪些智能外包出去、公司的边界在哪、人还扮演什么角色。
查看推文 →
eptwts @eptwts
如果不知道做什么能让自己满足,答案永远是先去追钱——它给你自由,让你在不被房租和朝九晚五压垮的情况下慢慢试、找到真正热爱的事;先把自己关起来,花几年逼出"解决能赚钱的问题"的本事。
查看推文 →

🔥 精选推荐

Aether AI 创始人黄碧薇 2026 年成立公司做"因果世界模型",已完成约 2000 万美元种子轮,经纬创投领投,英诺基金、SWC Global、九合创投跟投。她是 UCSD 助理教授,从计算神经科学转到因果 AI,主张真正的智能要理解世界"为什么这样运转",而不只是预测下一步。现在的世界模型大多走 3D、视频生成或 JEPA,她想做"第四条路"——用因果关系复刻物理世界的运行规律,先从 Physical AI 切入,定位更像一家 Frontier Lab。
🦐点评:经纬敢在"因果 AI"这种十年没出过商业化成果的方向下种子轮,赌的是 scaling 撞墙后市场对"另一条技术路线"的重新定价——黄碧薇自己也说"很多路线不试到一定阶段,没人信它走不通"。对 VC 真正的问题不是因果世界模型对不对,而是它离能用还有多远:她坦承过去学术圈"太重单点突破、忽略做成系统",而这恰恰是创业公司最容易死的地方。值得把她和那批 Physical AI 公司放一起盯,看因果路线是补充还是替代。
Z Potentials
字节 Seedance 2.0 出了 4K 视频模型,一条 15 秒 4K 约 88 元、一条一分钟广告片约 700 元,很贵,但每天给字节带来超 1 亿元收入、是豆包的 100 倍,唯一限制是显卡不够、官方 API 不打折还供不应求。作者由此提出"大模型 ROI 定律":资源有限时,算力和资本一定流向边际收益率最高的地方——这也是为什么中美大模型公司都先做 Coding(按职业 GDP 贡献排序选 RL 方向)。结论是别盯着价格,要看它替你省了多少时间、创造了多少价值,去找自己比别人强 10 倍的地方。
🦐点评:"一分钟广告片成本 700、市价 1 万起"这个差价才是 AI 视频赛道现在最硬的数据——它解释了为什么字节能靠一个贵模型日入过亿,也说明现阶段瓶颈在供给(显卡)不在需求。作者那句"能免费反而是大公司的机会、和你无关"对早期投资是个反直觉提醒:该投的是能把 token 卖出溢价的高价值场景公司,不是又一个赌"等降价跑量"的平价应用。上游愿意为效果付费,恰恰说明做生成式视频应用层的 ROI 是真的。
AGENT橘
文章讲的是给网球、匹克球俱乐部做软件的 PlayByPoint,作者是做 vertical AI 的创始人兼投资人 Luke Sophinos。核心判断:它表面是订场软件,实际是整个品类的"系统级账本"——把退款规则、可预订窗口、多人拼场付款这些通用软件懒得做对的烂活一件件做对,握住运营方信任后才打开支付、留存、营销、AI agent 等扩展。更尖锐的一点:AI 没在杀 vertical SaaS,而是抬高门槛——"花五年才建出这套"的老优势失效了,耐久优势从代码量转向对工作流的理解、信任和速度。作者也提醒,他既是 vertical AI 创始人又是投资人,这套说法本就是他的立场。
🦐点评:这篇最值钱的不是结论而是那个方法:从客户的组织架构表反推 agent 路线图——谁在干活、哪些活重复、哪儿在浪费人力,几十个过去因太贵太定制没人做的小流程现在能做了。对看 vertical SaaS 的人,判断标准要换:不再问"产品多厉害",而是问"谁握着系统级账本、谁和客户信任深到能拿到这些活"。难得的是作者自己拆穿了立场偏差,还点出"懂工作流"被 AI 加速后塌得比承认的快——真正难抢的是账本位置和信任,这点比正文更值得记。
深思SenseAI
作者复盘智谱怎么靠 Anthropic"成全"做到万亿市值:Claude Code 在中国封号、又退出中国,留下大量想用先进编程 agent 的需求,智谱用"Claude Code + GLM Coding Plan"的特色配置吃下大部分流量,至今智谱官方第一推荐的工具仍是 Claude Code。还点破智谱开创的匿名模型打榜营销——在 OpenRouter 上线免费的"Pony Alpha"让人猜是谁、最后揭晓是 GLM-5,后来小米"Hunter Alpha"、蚂蚁"大象"都照搬这套。智谱上市前七成收入来自 To B/To G 本地部署,唐杰年初发内部信要全面回归基础模型研究、以 Coding 为突破口。作者实测 GLM-5.2 对比 Kimi 2.7 Code,认为指令一多 GLM 明显拉开差距。
🦐点评:"Claude Code + 国产模型"这条中国特色用法,本质是 Anthropic 的封号和退出给智谱送了一个现成的分发渠道——一行配置命令就接住了 Claude Code 退出中国的流量,这种"借敌人产品做自己入口"的打法比模型本身更难复制。匿名模型打榜从智谱传到小米、蚂蚁已成行业套路,提醒看国产模型的人:OpenRouter 榜单和"国外网友都说好"的声量水分越来越大,得回到真实编程任务里验。智谱七成收入靠 To B/To G、唐杰回归基础模型才换来今天,说明国产模型的胜负手仍在模型本身,多模态和 C 端产品反而是次要战场。
葬AI

📌 其他值得看

OpenAI 和 Broadcom 联合发布首款自研芯片 Jalapeño(墨西哥辣椒),专做大模型推理加速而非训练,是 OpenAI 把自研延伸到芯片层的标志性一步。
赛博禅心
对标 Anthropic 的 Mythos,OpenAI 推出"Patch the Planet"计划和 GPT-5.5-Cyber,联合安全公司 Trail of Bits 帮开源项目维护者找并修漏洞。AI 自主做网络安全这条线,OpenAI 和 Anthropic 正面对上了。
Z Potentials
AI 把电力需求拉进更陡的曲线,能源成了 AI 能否继续扩张的约束,绿氢被重新推上台前。海德氢能完成 B+ 轮,阿美投资加码、海螺私募战略入股,此前投资方还包括中石化资本和红杉中国。
有新Newin