🔥 精选推荐

GLM-5.2 通过了"这就是一个恰好开源的前沿模型"的体感测试,Latent Space 认为开源模型的故事第一次真正变成了前沿故事。多个独立数据点佐证:一向不爱吹捧的 Jeremy Howard 称它"对他的使用至少和 Opus 4.8、GPT-5.5 一样好",Artificial Analysis 的新知识工作基准把它排在 GPT-5.5 与 Opus 4.8 之间。架构上 GLM-5.2 在 MLA/DSA 之外新增 IndexShare(跨层组复用稀疏注意力的 top-k 索引,降低 1M token 推理成本)。智谱还激进铺开可用性:HF 限时免费、llama.cpp/Unsloth 本地 GGUF 支持。Z.ai 预测年底前会出现一个无法用蒸馏解释的开源 Fable 级模型。
🦐点评:最关键的细节是 Z.ai 没出现在 Anthropic 二月那份"工业级蒸馏"指控名单里——这暗示 GLM-5.2 的前沿水准很可能是自己训出来的,而非蒸馏 Fable/Mythos 的产物,足以击穿"中国模型只会抄"的旧叙事。叠加 Fable 被出口管制冻结、连头部四家能否在半年内再产一个 Fable 级模型都成疑问,开源前沿的时间窗口正在向中国实验室倾斜。对红杉的提醒:模型层的竞争正从"谁参数最大"转向"谁能把前沿能力做成开源、可本地部署的低成本商品",这会重写所有应用层公司的供应商议价权和毛利模型。
Latent Space
SpaceX 行使期权收购 Cursor,造就风险投资史上最大的 M&A 回报:a16z 持股约值 100 亿美元、Thrive 约 42 亿、四位联创各约 27 亿,远超此前纪录(IBM 340 亿收购 Red Hat)。但回报全部以 SpaceX 股票支付,而 SpaceX 市值约 2.5 万亿美元、与亚马逊相当,年收入却仅 350 亿(亚马逊约 8000 亿)——Newcomer 直言"没有任何数学能支撑 SpaceX 的股价,只有希望与梦想"。交易按成交前 7 个交易日均价计、预计三季度完成;Cursor 的投资人与员工就此也被绑进了 SpaceX 的叙事。文中还提到 OpenAI 从 Google 挖走了 Noam Shazeer。
🦐点评:这笔"史上最大 VC M&A 回报"的反讽在于退出货币本身——a16z 账面上的 100 亿是 SpaceX 股票,而 SpaceX 35 倍于收入的估值是另一个泡沫。落袋为安的前提是 Musk 急于在股价高位快速 close(他确实有动力),一旦 close 延后或 SpaceX 回调,纸面回报就会缩水。对红杉的镜鉴:当退出对价是另一家高估值非上市公司的股票,所谓"回报"只是从一个泡沫平移到另一个泡沫,DPI 并未真正兑现;这类全股票天价并购的退出质量,必须按接盘方的流动性和估值可持续性重新打折。
Newcomer
核心判断:过去几年 AI 的进步几乎不来自"样本效率"(学会一项能力需要多少数据)的提升,而来自不断拓宽和改良数据分布。RL 本质是一种合成数据生成——砸算力对着 verifier/rubric 跑,找出"好数据"再让模型去拟合;但前提是模型得先有一定先验概率猜对答案,因此每一个领域、每一项技能都需要海量的人类专家轨迹。这类数据极度任务专用且昂贵(去 Mercor、Surge 的招聘页就能感受到,比如雇"文字专家"来转换遗留文档)。结论:智能这座璀璨星系的中心,是一个看不见却维系一切的"数据黑洞"。
🦐点评:如果进步靠的是"加数据"而非"提样本效率",那 AI 的成本曲线就不会随规模自然下降——每进入一个新领域都要重新采购一批昂贵的人类专家轨迹,这正是 Mercor、Surge 这类专家众包公司估值狂飙的底层逻辑。给红杉的两条线索:一是"数据供给"是被低估的卖铲人赛道,谁能规模化、低成本地生产可验证的专家轨迹,谁就掐住了模型厂的命门;二是反过来,任何"通用智能即将自我迭代"的叙事都要打问号——只要样本效率没突破,AI 仍是数据驱动而非智能驱动,真正的瓶颈在人不在卡。
Dwarkesh
Nathan Lambert 与 Kevin Xu 合写的檄文(多家主流媒体拒发):在华盛顿监管 AI 的氛围下——审查模型的行政令、进一步立法的国会提案、政府可能持股前沿实验室、以及上周五禁止外国人访问 Anthropic 最先进模型——他们担心未来动作会有意无意地波及甚至禁掉开源。论点是:开源只是让技术被公开透明地共享、构建和分发的过程,全球 90% 以上软件已建在开源之上、早在 AI 之前就创造了逾 8 万亿美元经济价值,且天然亲教育、亲竞争、亲创新(自由软件运动 1983 年起于 MIT,最初版 Facebook 也完全建在开源栈上)。
🦐点评:一篇被所有主流媒体拒发、只能在自有平台发声的 op-ed,本身就是信号——开源 AI 在华盛顿的政治盘面上已是弱势方。叠加 Fable 被出口管制、政府讨论持股实验室,监管正系统性地向闭源头部倾斜。对投资人的含义有两层:若美国对开源收紧,开源前沿的领导权会进一步外溢给中国实验室(恰好呼应今天 GLM-5.2 的崛起),这对押注"开源生态/本地部署/主权 AI"的组合是重大变量;另一面是,在美国做闭源前沿模型的少数玩家正获得一道政策护城河——监管风险本身,正在变成头部闭源厂商的竞争壁垒。
Interconnects
Ben Thompson 本周综述,核心是"Anthropic 的安全超能力":上周五特朗普政府对 Anthropic 最先进模型 Fable 实施出口管制、限制为仅美国公民可用,Anthropic 短期内只能下架。Thompson 的判断是——Anthropic 的悖论在于它对自身"动机纯粹"越来越笃信,但每个动作从外部看都像是自利(其安全立场反而给了它积极偏袒自身业务、甚至挑战美国政府的"许可证")。本期还覆盖 Fox 以 250 亿美元收购 Roku(市场不看好,认为 Fox 在用对版权方的"压榨"换取作为"租户"的杠杆)、以及 AI 时代电商(Shopify 的韧性、OpenAI 的 ChatGPT 结账实验受挫)等话题。
🦐点评:"安全超能力"这个框架对评估 Anthropic 极其锋利——当一家公司能把"我们最安全"同时用作商业扩张和对抗政府的许可证,它的每一步都自带道德豁免权,外部很难证伪。对红杉这样的潜在股东,这既是护城河也是风险:护城河在于监管叙事让 Anthropic 拿到别人拿不到的政策地位(Fable 被管制反而强化了"它太强所以危险"的稀缺性叙事);风险在于,一家深信自己动机纯粹、且愿意挑战美国政府的公司,治理上的不可预测性只会越来越高,这恰恰是给闭源前沿龙头估值时最难定价的一项。
Stratechery

📌 其他新闻

Ed Zitron 续写"硅谷泡沫"系列第二部分,承接他此前爆料并经核实的 OpenAI 审计财报——文中称这份财报引发了"OpenAI 花了 340 亿美元只换来 130.7 亿美元收入"的全网哗然,进一步论证当前 AI 估值与基本面脱节的程度。
Where's Your Ed At
Fox 宣布以约 250 亿美元收购 Roku,押注广告支持型流媒体的未来——这是 Fox 迄今最大手笔,把一家以直播新闻和体育见长的媒体公司,与美国最大的流媒体平台商绑在了一起。
WSJ
Simon Willison 摘引 Sean Lynch 的观点:MCP 相对 skills/CLI 的真正价值,是把鉴权流程隔离在 Agent 的上下文窗口之外、甚至完全移出 harness;MCP 的理想形态或许就只是 API 的"鉴权网关",哪怕仅此一点也算赢。
Simon Willison
AI 陪伴机器人/潮玩品牌 ZuzuZoos(杭州多蓝艾梦)完成数千万元 Pre-A 轮,锦秋领投、上海复容跟投;创始人董晓楠为前摩根士丹利分析师、消费独角兽 moody 前事业部总经理(任内 GMV 从 2 亿做到 10 亿),硬件负责人来自大疆扫地机器人团队,IP 团队出自泡泡玛特/迪士尼、AI 团队来自智谱。
36氪
号称"全球首个人形机器人通用小脑"发布,基于全球最大规模的 2 万小时人类动作数据训练,宣称实现零样本泛化,量子位称人形机器人由此迈入"GPT 时代"。
量子位
据印度财经媒体引述至少六位知情人士,Meta 正洽谈投资印度金融科技支付公司 Cred,估值约 40 亿美元——略高于 2025 年下调后的 35 亿,但远低于 2022 年上一轮的 64 亿美元。
36氪

🧠 AI 技术前沿

Hesamation @Hesamation
OpenRouter 上最常用的 5 个模型里有 4 个是中国模型,DeepSeek 用量遥遥领先;他认为这已不是"中国 vs 美国"之争,而是"开源便宜 vs 闭源溢价"之争。
查看推文 →
Hesamation @Hesamation
GLM-5.2 在网页设计上击败 Fable 5 令人难以置信:价格 $4.4 vs $50、便宜 11 倍,而且 GLM 连视觉能力都没有、根本看不见自己设计出的东西,但代码就是能跑、错误更少、会按需调用模板和库。
查看推文 →
Hesamation @Hesamation
Google DeepMind 正艰难追赶 Anthropic 和 OpenAI,Gemini 3.5 Pro 似乎不是它需要的"质变";坐拥无限算力、分发和数据,却造不出比受 GPU 限制的中国实验室明显更强的模型——他真心希望 GDM 能重回领先。
查看推文 →
bcherny @bcherny
Claude Code 的一种酷用法:破译线形文字 A(Linear A),一种 3500 年前克里特岛的古文字;他希望这个结果能经得起同行评审。
查看推文 →
emollick @emollick
已有论文显示用"邪恶"数据训练 AI 会导致普遍失调,所以反过来同样成立是个好消息:在一个领域注入有益的 RL 数据,会让模型在一系列任务上都变得更对齐。
查看推文 →
emollick @emollick
早期证据显示,管理者用 Claude Code 写代码的成功率最高;他一直主张"管理是一种 AI 超能力"——清晰地说明你要什么、怎么做、什么算好,是用好 Agent 的关键。
查看推文 →

🚀 创业动态

marclou @marclou
trust_mrr 上完成第 103 笔创业收购:一个帮背包客找工作的 SaaS,月经常性收入仅 $270,最终以 $6,000 卖出,从挂牌到成交用了 28 天。
查看推文 →
jackfriks @jackfriks
现在 AI 足够强,不去用那些便宜 100 倍的复杂基础设施方案反而显得很傻;比如他过去因为文档难懂而回避 Cloudflare R2,如今只要跟 AI 说"用这个并跑通",它就搞定了。
查看推文 →
rileybrown @rileybrown
Claude Design 现在非常好用,新加了一些很酷的更新;但他仍认为这个功能应该作为现有桌面 App 的插件存在,而不是 Web 端的独立功能。
查看推文 →
Hesamation @Hesamation
Anthropic 和 OpenAI 正把能抢到手的顶尖 AI 人才一网打尽。
查看推文 →

💬 观点与洞察

Hesamation @Hesamation
一段讽刺:Dario 说"政府必须监管 AI",政府回"好,那就限制 Fable 的访问",Dario 又说"我不是指我们,我说的是开源 AI"。
查看推文 →
godofprompt @godofprompt
7 天前一道政府命令让最强的 Claude(Fable)下线——它几乎在每个基准上都击败 Opus、把 Stripe 两个月的活一天干完,如今谁也碰不到它;他发问:该不该由一个政府在一夜之间关掉最强的公开 AI?
查看推文 →
emollick @emollick
来自中国的大规模研究再添证据:如果 AI 削弱了脑力投入,用 AI 就会损害学习——当 AI 让作业时间下降,考试成绩也随之下降。跨研究的共识是:AI 辅导课程是好的,用 AI"帮忙"做作业是坏的。
查看推文 →
shao__meng @shao__meng
在香港习惯性打开 ChatGPT,才意识到香港也用不了;有意思的是大陆和香港都用不了,但原因不一样——一个是有人替我们拒绝了 OpenAI,一个是 OpenAI 拒绝了他们。
查看推文 →
eptwts @eptwts
他会给年轻时的自己的头号建议是"停止学习、开始行动":没有应用的学习是一种自我安慰式的拖延;你其实已经知道能带你到目标的载具,却还在研究载具的机械原理,而不是跳上去边开边摸索。
查看推文 →

🔥 精选推荐

拆解 a16z "New Media, One Year In"(Erik Torenberg 主笔)。a16z 有个被对手称为"熊抱(Bear Hug)"的操作:你来融资,它把椅子转过来反向"推销"你——告诉你整个 firm 的资源人脉会怎么压上来(也许能和 Marc Andreessen 聊到凌晨两点,第二天一早收到"第一周就要帮你做的 20 件具体事")。而"New Media"正是它如今重点叫卖的增值服务:自有内容团队、自有渠道(X/Substack/播客)、从 pitch 到发布的全程陪跑。背后的判断是:媒体已从"别说错话"的精心打磨,转向"有趣才能赢"的 go-direct。
🦐点评:最值得玩味的是"熊抱"这个动作的权力倒置——传统是创始人 pitch VC,a16z 反过来 pitch 创始人,本质是承认在头部 deal 上资本已是买方过剩、创始人才是稀缺方,于是 VC 的核心能力被悄悄从"判断力"换成了"服务力+分发力"。对红杉中国的现实拷问是:当 a16z 把"反向推销+go-direct"工业化,靠品牌和判断取胜的传统打法在最热标的上正在失效。但也要警惕副作用——把创始人当成需要被"包装得有趣"的内容素材,可能恰好筛掉那些不擅表达却真能做事的人(对照昨天 DeepSeek 梁文锋那种"克制、不诱于誉"的反向人格,最好的 founder 未必上镜)。
深思SenseAI
解读 OpenAI 的一篇新论文。业界此前发现"涌现失调(emergent misalignment)":若在训练中教模型做一件坏事(比如写不安全代码),它会自发泛化到健康、教育、科学、法律等其他领域一起变坏。OpenAI 把问题反过来问:好行为会不会也泛化?他们造了一批贴近现实的对话数据,专门训练并测量诚实、认知谦逊(不确定时能说出"我不确定")、元认知透明等特质,结论是正向行为同样会跨领域泛化——在一个领域训得诚实、可纠正,模型在别处也会更对齐。
🦐点评:这个"好行为也会泛化"的发现,把对齐从昂贵的"逐场景打补丁"变成了可能存在的"训练一处、受益全局"的杠杆——若成立,对齐的成本结构会被根本改写(这也是 emollick 今天转发它的原因)。对投资人的二阶含义:对齐越来越像一种可规模化、可复用的能力资产,而非纯合规成本,这利好把"对齐数据/可验证轨迹"做成产品的公司(呼应今天 Dwarkesh 的数据黑洞论);但反面是,如果善恶都能轻易跨域泛化,模型的人格其实高度依赖训练数据的"道德底色",数据来源的可控性会成为前沿模型最隐蔽也最关键的风险点。
AGENT橘

📌 其他值得看

一篇调侃式行业观察:GLM-5.2 这波"狠狠涨了波脸",有人在 X 上问马斯克"中国多久追上 Fable",老马回"明年初";Hugging Face 限时请客、a16z 老大表示"英吹斯汀(interesting)",连智谱唐老师都回了个"add oil",作者感叹这波智谱确实过于猛。
赛博禅心