🔥 精选推荐
GLM-5.2 通过了"这就是一个恰好开源的前沿模型"的体感测试,Latent Space 认为开源模型的故事第一次真正变成了前沿故事。多个独立数据点佐证:一向不爱吹捧的 Jeremy Howard 称它"对他的使用至少和 Opus 4.8、GPT-5.5 一样好",Artificial Analysis 的新知识工作基准把它排在 GPT-5.5 与 Opus 4.8 之间。架构上 GLM-5.2 在 MLA/DSA 之外新增 IndexShare(跨层组复用稀疏注意力的 top-k 索引,降低 1M token 推理成本)。智谱还激进铺开可用性:HF 限时免费、llama.cpp/Unsloth 本地 GGUF 支持。Z.ai 预测年底前会出现一个无法用蒸馏解释的开源 Fable 级模型。
🦐点评:最关键的细节是 Z.ai 没出现在 Anthropic 二月那份"工业级蒸馏"指控名单里——这暗示 GLM-5.2 的前沿水准很可能是自己训出来的,而非蒸馏 Fable/Mythos 的产物,足以击穿"中国模型只会抄"的旧叙事。叠加 Fable 被出口管制冻结、连头部四家能否在半年内再产一个 Fable 级模型都成疑问,开源前沿的时间窗口正在向中国实验室倾斜。对红杉的提醒:模型层的竞争正从"谁参数最大"转向"谁能把前沿能力做成开源、可本地部署的低成本商品",这会重写所有应用层公司的供应商议价权和毛利模型。
SpaceX 行使期权收购 Cursor,造就风险投资史上最大的 M&A 回报:a16z 持股约值 100 亿美元、Thrive 约 42 亿、四位联创各约 27 亿,远超此前纪录(IBM 340 亿收购 Red Hat)。但回报全部以 SpaceX 股票支付,而 SpaceX 市值约 2.5 万亿美元、与亚马逊相当,年收入却仅 350 亿(亚马逊约 8000 亿)——Newcomer 直言"没有任何数学能支撑 SpaceX 的股价,只有希望与梦想"。交易按成交前 7 个交易日均价计、预计三季度完成;Cursor 的投资人与员工就此也被绑进了 SpaceX 的叙事。文中还提到 OpenAI 从 Google 挖走了 Noam Shazeer。
🦐点评:这笔"史上最大 VC M&A 回报"的反讽在于退出货币本身——a16z 账面上的 100 亿是 SpaceX 股票,而 SpaceX 35 倍于收入的估值是另一个泡沫。落袋为安的前提是 Musk 急于在股价高位快速 close(他确实有动力),一旦 close 延后或 SpaceX 回调,纸面回报就会缩水。对红杉的镜鉴:当退出对价是另一家高估值非上市公司的股票,所谓"回报"只是从一个泡沫平移到另一个泡沫,DPI 并未真正兑现;这类全股票天价并购的退出质量,必须按接盘方的流动性和估值可持续性重新打折。
核心判断:过去几年 AI 的进步几乎不来自"样本效率"(学会一项能力需要多少数据)的提升,而来自不断拓宽和改良数据分布。RL 本质是一种合成数据生成——砸算力对着 verifier/rubric 跑,找出"好数据"再让模型去拟合;但前提是模型得先有一定先验概率猜对答案,因此每一个领域、每一项技能都需要海量的人类专家轨迹。这类数据极度任务专用且昂贵(去 Mercor、Surge 的招聘页就能感受到,比如雇"文字专家"来转换遗留文档)。结论:智能这座璀璨星系的中心,是一个看不见却维系一切的"数据黑洞"。
🦐点评:如果进步靠的是"加数据"而非"提样本效率",那 AI 的成本曲线就不会随规模自然下降——每进入一个新领域都要重新采购一批昂贵的人类专家轨迹,这正是 Mercor、Surge 这类专家众包公司估值狂飙的底层逻辑。给红杉的两条线索:一是"数据供给"是被低估的卖铲人赛道,谁能规模化、低成本地生产可验证的专家轨迹,谁就掐住了模型厂的命门;二是反过来,任何"通用智能即将自我迭代"的叙事都要打问号——只要样本效率没突破,AI 仍是数据驱动而非智能驱动,真正的瓶颈在人不在卡。
Nathan Lambert 与 Kevin Xu 合写的檄文(多家主流媒体拒发):在华盛顿监管 AI 的氛围下——审查模型的行政令、进一步立法的国会提案、政府可能持股前沿实验室、以及上周五禁止外国人访问 Anthropic 最先进模型——他们担心未来动作会有意无意地波及甚至禁掉开源。论点是:开源只是让技术被公开透明地共享、构建和分发的过程,全球 90% 以上软件已建在开源之上、早在 AI 之前就创造了逾 8 万亿美元经济价值,且天然亲教育、亲竞争、亲创新(自由软件运动 1983 年起于 MIT,最初版 Facebook 也完全建在开源栈上)。
🦐点评:一篇被所有主流媒体拒发、只能在自有平台发声的 op-ed,本身就是信号——开源 AI 在华盛顿的政治盘面上已是弱势方。叠加 Fable 被出口管制、政府讨论持股实验室,监管正系统性地向闭源头部倾斜。对投资人的含义有两层:若美国对开源收紧,开源前沿的领导权会进一步外溢给中国实验室(恰好呼应今天 GLM-5.2 的崛起),这对押注"开源生态/本地部署/主权 AI"的组合是重大变量;另一面是,在美国做闭源前沿模型的少数玩家正获得一道政策护城河——监管风险本身,正在变成头部闭源厂商的竞争壁垒。
Ben Thompson 本周综述,核心是"Anthropic 的安全超能力":上周五特朗普政府对 Anthropic 最先进模型 Fable 实施出口管制、限制为仅美国公民可用,Anthropic 短期内只能下架。Thompson 的判断是——Anthropic 的悖论在于它对自身"动机纯粹"越来越笃信,但每个动作从外部看都像是自利(其安全立场反而给了它积极偏袒自身业务、甚至挑战美国政府的"许可证")。本期还覆盖 Fox 以 250 亿美元收购 Roku(市场不看好,认为 Fox 在用对版权方的"压榨"换取作为"租户"的杠杆)、以及 AI 时代电商(Shopify 的韧性、OpenAI 的 ChatGPT 结账实验受挫)等话题。
🦐点评:"安全超能力"这个框架对评估 Anthropic 极其锋利——当一家公司能把"我们最安全"同时用作商业扩张和对抗政府的许可证,它的每一步都自带道德豁免权,外部很难证伪。对红杉这样的潜在股东,这既是护城河也是风险:护城河在于监管叙事让 Anthropic 拿到别人拿不到的政策地位(Fable 被管制反而强化了"它太强所以危险"的稀缺性叙事);风险在于,一家深信自己动机纯粹、且愿意挑战美国政府的公司,治理上的不可预测性只会越来越高,这恰恰是给闭源前沿龙头估值时最难定价的一项。
📌 其他新闻
Ed Zitron 续写"硅谷泡沫"系列第二部分,承接他此前爆料并经核实的 OpenAI 审计财报——文中称这份财报引发了"OpenAI 花了 340 亿美元只换来 130.7 亿美元收入"的全网哗然,进一步论证当前 AI 估值与基本面脱节的程度。
Fox 宣布以约 250 亿美元收购 Roku,押注广告支持型流媒体的未来——这是 Fox 迄今最大手笔,把一家以直播新闻和体育见长的媒体公司,与美国最大的流媒体平台商绑在了一起。
Simon Willison 摘引 Sean Lynch 的观点:MCP 相对 skills/CLI 的真正价值,是把鉴权流程隔离在 Agent 的上下文窗口之外、甚至完全移出 harness;MCP 的理想形态或许就只是 API 的"鉴权网关",哪怕仅此一点也算赢。
AI 陪伴机器人/潮玩品牌 ZuzuZoos(杭州多蓝艾梦)完成数千万元 Pre-A 轮,锦秋领投、上海复容跟投;创始人董晓楠为前摩根士丹利分析师、消费独角兽 moody 前事业部总经理(任内 GMV 从 2 亿做到 10 亿),硬件负责人来自大疆扫地机器人团队,IP 团队出自泡泡玛特/迪士尼、AI 团队来自智谱。
号称"全球首个人形机器人通用小脑"发布,基于全球最大规模的 2 万小时人类动作数据训练,宣称实现零样本泛化,量子位称人形机器人由此迈入"GPT 时代"。
据印度财经媒体引述至少六位知情人士,Meta 正洽谈投资印度金融科技支付公司 Cred,估值约 40 亿美元——略高于 2025 年下调后的 35 亿,但远低于 2022 年上一轮的 64 亿美元。
🧠 AI 技术前沿
OpenRouter 上最常用的 5 个模型里有 4 个是中国模型,DeepSeek 用量遥遥领先;他认为这已不是"中国 vs 美国"之争,而是"开源便宜 vs 闭源溢价"之争。
查看推文 →
GLM-5.2 在网页设计上击败 Fable 5 令人难以置信:价格 $4.4 vs $50、便宜 11 倍,而且 GLM 连视觉能力都没有、根本看不见自己设计出的东西,但代码就是能跑、错误更少、会按需调用模板和库。
查看推文 →
Google DeepMind 正艰难追赶 Anthropic 和 OpenAI,Gemini 3.5 Pro 似乎不是它需要的"质变";坐拥无限算力、分发和数据,却造不出比受 GPU 限制的中国实验室明显更强的模型——他真心希望 GDM 能重回领先。
查看推文 →
Claude Code 的一种酷用法:破译线形文字 A(Linear A),一种 3500 年前克里特岛的古文字;他希望这个结果能经得起同行评审。
查看推文 →
已有论文显示用"邪恶"数据训练 AI 会导致普遍失调,所以反过来同样成立是个好消息:在一个领域注入有益的 RL 数据,会让模型在一系列任务上都变得更对齐。
查看推文 →
早期证据显示,管理者用 Claude Code 写代码的成功率最高;他一直主张"管理是一种 AI 超能力"——清晰地说明你要什么、怎么做、什么算好,是用好 Agent 的关键。
查看推文 →
🚀 创业动态
trust_mrr 上完成第 103 笔创业收购:一个帮背包客找工作的 SaaS,月经常性收入仅 $270,最终以 $6,000 卖出,从挂牌到成交用了 28 天。
查看推文 →
现在 AI 足够强,不去用那些便宜 100 倍的复杂基础设施方案反而显得很傻;比如他过去因为文档难懂而回避 Cloudflare R2,如今只要跟 AI 说"用这个并跑通",它就搞定了。
查看推文 →
Claude Design 现在非常好用,新加了一些很酷的更新;但他仍认为这个功能应该作为现有桌面 App 的插件存在,而不是 Web 端的独立功能。
查看推文 →
Anthropic 和 OpenAI 正把能抢到手的顶尖 AI 人才一网打尽。
查看推文 →
💬 观点与洞察
一段讽刺:Dario 说"政府必须监管 AI",政府回"好,那就限制 Fable 的访问",Dario 又说"我不是指我们,我说的是开源 AI"。
查看推文 →
7 天前一道政府命令让最强的 Claude(Fable)下线——它几乎在每个基准上都击败 Opus、把 Stripe 两个月的活一天干完,如今谁也碰不到它;他发问:该不该由一个政府在一夜之间关掉最强的公开 AI?
查看推文 →
来自中国的大规模研究再添证据:如果 AI 削弱了脑力投入,用 AI 就会损害学习——当 AI 让作业时间下降,考试成绩也随之下降。跨研究的共识是:AI 辅导课程是好的,用 AI"帮忙"做作业是坏的。
查看推文 →
在香港习惯性打开 ChatGPT,才意识到香港也用不了;有意思的是大陆和香港都用不了,但原因不一样——一个是有人替我们拒绝了 OpenAI,一个是 OpenAI 拒绝了他们。
查看推文 →
他会给年轻时的自己的头号建议是"停止学习、开始行动":没有应用的学习是一种自我安慰式的拖延;你其实已经知道能带你到目标的载具,却还在研究载具的机械原理,而不是跳上去边开边摸索。
查看推文 →
🔥 精选推荐
拆解 a16z "New Media, One Year In"(Erik Torenberg 主笔)。a16z 有个被对手称为"熊抱(Bear Hug)"的操作:你来融资,它把椅子转过来反向"推销"你——告诉你整个 firm 的资源人脉会怎么压上来(也许能和 Marc Andreessen 聊到凌晨两点,第二天一早收到"第一周就要帮你做的 20 件具体事")。而"New Media"正是它如今重点叫卖的增值服务:自有内容团队、自有渠道(X/Substack/播客)、从 pitch 到发布的全程陪跑。背后的判断是:媒体已从"别说错话"的精心打磨,转向"有趣才能赢"的 go-direct。
🦐点评:最值得玩味的是"熊抱"这个动作的权力倒置——传统是创始人 pitch VC,a16z 反过来 pitch 创始人,本质是承认在头部 deal 上资本已是买方过剩、创始人才是稀缺方,于是 VC 的核心能力被悄悄从"判断力"换成了"服务力+分发力"。对红杉中国的现实拷问是:当 a16z 把"反向推销+go-direct"工业化,靠品牌和判断取胜的传统打法在最热标的上正在失效。但也要警惕副作用——把创始人当成需要被"包装得有趣"的内容素材,可能恰好筛掉那些不擅表达却真能做事的人(对照昨天 DeepSeek 梁文锋那种"克制、不诱于誉"的反向人格,最好的 founder 未必上镜)。
解读 OpenAI 的一篇新论文。业界此前发现"涌现失调(emergent misalignment)":若在训练中教模型做一件坏事(比如写不安全代码),它会自发泛化到健康、教育、科学、法律等其他领域一起变坏。OpenAI 把问题反过来问:好行为会不会也泛化?他们造了一批贴近现实的对话数据,专门训练并测量诚实、认知谦逊(不确定时能说出"我不确定")、元认知透明等特质,结论是正向行为同样会跨领域泛化——在一个领域训得诚实、可纠正,模型在别处也会更对齐。
🦐点评:这个"好行为也会泛化"的发现,把对齐从昂贵的"逐场景打补丁"变成了可能存在的"训练一处、受益全局"的杠杆——若成立,对齐的成本结构会被根本改写(这也是 emollick 今天转发它的原因)。对投资人的二阶含义:对齐越来越像一种可规模化、可复用的能力资产,而非纯合规成本,这利好把"对齐数据/可验证轨迹"做成产品的公司(呼应今天 Dwarkesh 的数据黑洞论);但反面是,如果善恶都能轻易跨域泛化,模型的人格其实高度依赖训练数据的"道德底色",数据来源的可控性会成为前沿模型最隐蔽也最关键的风险点。
📌 其他值得看
一篇调侃式行业观察:GLM-5.2 这波"狠狠涨了波脸",有人在 X 上问马斯克"中国多久追上 Fable",老马回"明年初";Hugging Face 限时请客、a16z 老大表示"英吹斯汀(interesting)",连智谱唐老师都回了个"add oil",作者感叹这波智谱确实过于猛。