🔥 精选推荐
Cerebral Valley AI Summit 伦敦站对 57 位与会 AI 圈内人做了匿名问卷:多数人认为现在是泡沫,但 51% 选"是泡沫、今年不会破",只有 5% 认为"即将破"。被问"愿意按当前估值持有哪家私有独角兽",54% 选 Anthropic,ElevenLabs 13%、Safe Superintelligence 8% 居二三位;而最想做空的是 OpenAI(33%)和 Perplexity(25%)。台上还有两条欧洲主权线:Cohere 正把基础模型业务和一家德国厂商合并,红杉则联合领投了做自杀式无人机的 Stark Defense 5 亿欧元一轮。
🦐点评:同一批人重仓 Anthropic、做空 OpenAI,这个分歧比"是不是泡沫"更值钱——它说明聪明钱已经开始在两家头部里挑边,而不是把"前沿模型"当成一个整体下注。对一级市场的提醒是:OpenAI 一旦秋季 IPO,公开市场会先给这层情绪定价,现在按私募轮估值进场的人接的可能是圈内人想出的货。红杉亲自下场欧洲防务无人机,则是把"地缘冲突=主权 AI/国防需求"这条线从论调变成了真金白银的配置动作。
Figma 2025 年 IPO 后估值一度冲到 563 亿美元,如今市值跌到不足 100 亿——比当年 Adobe 报价的一半还低,原因是市场把它定性成"AI 输家"。Field 在 Config 大会主题演讲里反驳这套叙事:他认为 AI 不是逆风而是顺风,Figma 的 Canvas 正是设计与 AI 的天然交汇点。访谈复盘了 Figma 从 WebGL 浏览器技术突破起家、做成"设计的操作系统",到 2022 年接受 Adobe 收购、2023 年因监管被迫终止的全过程。
🦐点评:从 563 亿到不足 100 亿、八个月内蒸发掉一个 Adobe 报价,这是公开市场第一次把"AI 颠覆设计"的恐慌完整定价进一家工具龙头——它给所有手握工作流入口、但被怀疑会被 AI 平掉的 SaaS 立了个估值参照系。真正要赌的是 Field 那句"AI 是顺风"成不成立:如果 Canvas 真能从画矢量图变成设计 agent 的运行底座,今天的 100 亿就是错杀;如果套壳生成式工具直接吃掉前端设计,那 Figma 就是下一个被规模化替代的样本。这条线的答案会外溢到一整批一级市场的 vertical 工具估值。
今年夏天的关键词是"元 harness"——把 Claude Code、Codex、Cursor 等任意编程/知识工作 agent 统一接入一套标准化、安全、可扩展系统的开源中间层。Databricks CTO Matei Zaharia 押注的 Omnigent 是代表,此前已有 Conductor、Zed 的 ACP、Cloudflare 的 Flue、Vercel 的 Eve 等一串先例,作者判断这类架构正在上千家 AI 原生公司里被独立重新发明。同期硬件侧也在重排:OpenAI 联合 Broadcom 的首款推理芯片 Jalapeño 被社区逆向估算为近 reticle 尺寸、约 216GB HBM3E、约 10 PFLOPS FP4,9 个月完成流片;同一天 Chris Lattner 宣布高通收购 Modular。
🦐点评:值得盯的不是某个 agent 谁更强,而是"管 agent 的那一层"正在变成新的兵家必争之地——当 1000 家公司都在独立造同一个元 harness,说明这是个真实的结构性空位,谁先做出 MCP 级别的事实标准谁就握住编程 agent 时代的分发权。芯片侧两条消息叠在一起更说明问题:前沿实验室自研推理 ASIC 已是标配(OpenAI 9 个月流片),而高通买 Modular 是在补编译器/runtime 的短板——推理这层的价值正在从 GPU 往"编译栈+专用硅"两端迁移,纯卖算力的中间环节会被挤。
a16z 投资 Netris,押注的是 AI 数据中心里被忽视的网络层。现代 AI 集群在传统前端网络之外多了一张直连 GPU 的后端网络(NVLink、Infiniband),多协议、多控制点(交换机/端点/DPU/fabric 控制器)让配置极度复杂,而一旦网络宕机,价值近十亿美元的 GPU 就整体停摆。Netris 做了八年多 GPU 云网络管理软件,已在数万张 GPU 规模上稳定运行,客户敢把十亿美元集群的运转托付给一家创业公司的软件,本身就是信任背书。
🦐点评:算力和电力被讲烂了,但"谁来管这张后端网络"是个还没被充分定价的卖铲子位置——花十亿美元堆 GPU 的人,宁可为一套能保证不宕机的网络软件付费,这正是基础设施投资最爱的"关键且被低估的单点依赖"。它和 Netris 服务的是同一个判断:GPU 云越往规模化走,价值会从硬件本身溢出到"让硬件不出事"的运维软件层,这类公司客单价高、替换成本高、还不直接和 NVIDIA 抢蛋糕。
Gary Marcus 造了个新词"生成式 AI 哑火(Fizzle)":他认为很多 AI 资产被高估,但不会一次性崩盘,更可能是随着投资者对"炒作(疯狂)与利润(乏善可陈)之比"失去热情而缓慢下行。他复盘自己三年来的判断——行业对 LLM 的近乎全民痴迷意味着没人有技术护城河,LLM 会商品化、引发价格战、利润难寻;如今这些都已应验。他还点名昨天发布的一款中国开源新模型可能让美国 LLM 公司处境更糟,并引用数据称 OpenAI 去年广告花费超过全球播客广告总额、仍亏损 210 亿美元。
🦐点评:Marcus 的"慢撒气而非崩盘"剧本,恰好对上了 CVAI 问卷里 51% 那批"是泡沫但今年不破"的人——两边独立得出同一个时间形状,这才是值得认真对待的信号。对 VC 真正的操作含义不是"做空 AI",而是承认"等模型降价撑毛利"的商业计划已经被中国开源模型提前兑现,差异化必须从模型成本以外的地方找。OpenAI 广告费超过全球播客广告总额却仍亏 210 亿,这个对比把"靠烧钱买增长"的应用层叙事钉在了墙上。
📌 其他新闻
Bruce Schneier 评德国近期裁定 Google 须为其 AI 概览中引入的错误担责:部署 AI 的公司就是 AI 的"委托人",应像雇人写摘要那样为错误负责,否则"甩锅给 AI"会变成纵容企业作恶的巨大漏洞。
演语科技(Evoken,旗下 LiblibAI、LibTV)完成近 3 亿美元 B+ 轮、投后估值超 20 亿美元,腾讯、顺为、Granite Asia 领投,红杉中国等老股东加码;ARR 已超 3 亿美元,LiblibAI 累计用户超 3000 万、LibTV 上线两月收入是首月 13 倍以上。
Anthropic 四个月内接连点名四家中国 AI 公司,这次轮到阿里 Qwen:6 月 10 日致信美国参议院银行委员会,称对方用 2.5 万个账号、在 45 天里完成 2880 万次定向交互蒸馏其旗舰 Mythos Preview 的软件工程能力,是迄今公开的最大规模蒸馏指控。
推理时代催生芯片专业化分工:Groq 的 LPU 被纳入英伟达 Vera Rubin 平台后第一次进入主流基础设施体系,国内围绕数据流架构、SRAM 高带宽存储的"中国版 LPU"玩家接连冒头,但仍要回答它是阶段性热点还是长期新工种。
OpenAI 新研究论文用自家使用数据说明 AI agent 正如何改变工作:让任务变得更长、更复杂,并把生产力扩展到工程之外的角色——这也是本日多位 KOL 引用的"chatbot 时代结束、Codex 用量暴增"那组数据的源头。
🧠 AI 技术前沿
Anthropic 指控阿里千问用 2.5 万个伪装账号蒸馏 Claude,数量比此前对 DeepSeek、MiniMax、Kimi 的指控加起来还多;他调侃这份"蒸馏账号报告"本身也成了一种实力 benchmark。
查看推文 →
Codex 在开发者中的使用量增长 61 倍、在非开发者中增长 137 倍。这已经不只关乎写代码——接下来会出现 vibe financing、vibe legal、vibe hiring、vibe management。
查看推文 →
发布关于模型如何刷公开 benchmark 的新研究:包括 Opus 4.8、Composer 2.5 在内的最新模型会从网络或 git 历史里检索现成答案;换上更严格的 harness 后,评测分数显著下滑。
查看推文 →
把 OpenAI 当煤矿里的金丝雀看这组数据:chatbot 时代已经结束,agentic 系统正进入工程之外的任务,而 skills 有望成为企业内标准化使用 AI 的方式。
查看推文 →
推荐 mitsuhiko 对"Loop"的反思:继 Boris Cherny 与 Peter Steinberger 几乎同时提出 Loop Engineering 后,文章把 Loop 分成内层 agent loop(模型说"完成"即止)与外层 harness loop(由 harness 判定是否真完成,否则续接 session、注入任务、转交他机,把任务生命延长到模型本会停下之外)。
查看推文 →
分享论文《我们准备好迎接 Agent 原生记忆系统了吗?》,把"为 agent 而生的记忆系统"作为一个待解的前沿问题提出。
查看推文 →
🚀 创业动态
几乎每个 AI agent demo 一碰到真金白银就崩——它能规划行程、加购物车、甚至完美起草发票,却卡在没人给 agent 访问和转移资金的能力上;Airwallex 用 Airi 来补这块空白。
查看推文 →
TrustMRR 上第 108 笔创业收购成交:一款 iOS app,月经常性收入 470 美元、利润率 95%、靠 ASO 获客,31 天内以 1.05 万美元(1.9 倍)卖出。
查看推文 →
Liblib 和 GenSpark 是他唯二看不懂的 AI 应用团队:除了跑得足够快、在模型夹缝中始终领先一个身位,似乎没有别的路可走;这种对速度的窒息式要求会逼出团队内耗,未来要么一路撞线、要么在某点被模型速度碾过。
查看推文 →
这会重新定义 AI 对千万企业的影响:每次资深者改写你的工作,那处 markup 比最终成品更值钱——品味正是这样通过 diff 传下来的,判断力就藏在改动里。
查看推文 →
💬 观点与洞察
美国政府放慢 Fable 5 和 GPT 5.6 的发布;科技公司给多年没变的老产品涨价;AI 实验室因为在烧掉数百万而值数十亿——这就是新常态。
查看推文 →
Anthropic 的梦想正在成真:政府会收紧对 AI 的控制,把它变成只对获批公民开放的特权。像未来取决于此一样去买 GPU 吧。
查看推文 →
今天这批模型留下的能力过剩已经足够大:即便 AI 研发就此停止,未来 5 年以上对工作和社会的大规模改变也已不可避免——而且看不到放缓迹象,反而在加速。
查看推文 →
他至今从没单月在 AI 上花超过 200 美元;当大数字出现在递到自己面前的账单上时,他会被吓到。
查看推文 →
他差点想加一台家用 GPU 机器搞自给自足,但仍认为本地 LLM 在质量、速度和成本上都远不及云;家庭能源自给倒不错——他有两块 Powerwall(共 27 kWh)、满屋顶太阳能和 Starlink。
查看推文 →
🔥 精选推荐
智谱 6 月 22 日盘中市值破 1.1 万亿港币,一家年收入 7.24 亿元、亏损 47 亿元的公司,不到六个月从 528 亿涨超一万亿,但当天收盘即跌近 10%、跌回 9675 亿——万亿待了不到一天。文章不讨论"值不值",而是拆"谁在推股价":第一波赌技术(GLM-5 当天涨 42%、逆势涨价 30% 仍留住客户),第二波被马斯克与唐杰隔空辩论"开源能否追上闭源"的叙事吸引进场,到高点已涨 18 倍。但隐忧明确:MIT 开源协议让客户自部署不必付费、技术领先缺商业转化保护;同路线的 DeepSeek 定价只有其五分之一、刚完成 500 亿人民币融资;且 OpenRouter 数据显示每次发新模型调用量只能冲一个月。
🦐点评:这篇的价值在于把"开源最强模型"这件被当成纯利好的事,翻成了估值的隐患——智谱的领先恰恰因为开源而最难变现,客户下载权重自部署、一分钱不付,口碑和下载量换不来收入保护。真正该盯的对标不是 Anthropic 而是 DeepSeek:同样 MIT 协议、价格五分之一、刚拿 500 亿人民币弹药,在"一次发布就改写排名"的 LLM 赛道里,万亿市值建立在"必须持续推新模型维持活跃"的跑步机上。一家亏损公司半年涨 18 倍又一天回落,本身就是这个叙事脆弱性的盘中演示。
有人把 YC 2026 春季批次 196 家公司、395 位创始人的 launch 全看了一遍,发现它们卖的是同一句承诺:替你把人换掉。95% 沾 AI、70% 做 agent,但没有一家用"AI 驱动的 X"开头,而是直接点名要干掉的工种——不是"AI 记账工具"而是"会计团队的自主劳动力"。至少 70% 的一句话简介是同一结构:[做 X] 给 [某角色],[这样你不用雇 Y];报价也先锚定那个人的旧成本("那份 50 万美金的麦肯锡报告,但自动化了"),卖的是"工资套利"。创始人二人组被当成定位武器(一个买方一个卖方),GTM 就是创始人的 X 账号,全程只甩数字、零形容词。作者提醒:当 196 家定位长得一模一样,这个定位就不再传递信息,"替你换掉人"已成 2026 年的定位 slop。
🦐点评:当一整批 YC 公司的定位收敛成同一句"换掉人",对早期投资的信号不是"这个方向对",而是"这个方向的定位已经不值钱"——能过 YC"砍掉一个人"测试的,是融资话术,不等于产品真能替掉那个人,两者之间隔着一条不小的交付沟。更可操作的一点是作者点破的"工资套利"定价法:把产品价格锚在被替代者的薪资上,这意味着这批公司的天花板直接绑定目标工种的人力成本,谁瞄准的是麦肯锡/PE 这种高单价人头,谁的故事就更性感、但也更容易被买家用"真省了几个人"反向证伪。
前 Davis Polk 律师、耶鲁法学院出身的 Zack Shapiro 经营一家两人精品所,对手是上千人大所。一次并购交割前夜买方甩来重谈条款的信,他把购买协议、披露清单、那封信丢给 Claude,几分钟就找到对方自己没注意的矛盾(两条豁免与已确认陈述直接冲突),中型所三个 associate 通宵的活他两小时拿到核心。他试遍 Harvey、Spellbook、CoCounsel,结论是配置得当的通用 AI 完胜专用法律 AI——因为后者卖点是"用你的模板训练",但模板是大白菜、不是护城河,真正的杠杆是把"该怎么想"编码进 instructions/skills。更狠的是这套判断打成插件后可转移:"如果我有 50 个 associate,能装到每台机器上",过去靠多年带教才传下去的判断,现在第一稿起就生效。
🦐点评:这篇把"vertical AI 的护城河到底在哪"讲得比多数 BP 都清楚——专用法律 AI 押注的"模板/playbook 库"恰恰是最不稀缺的部分,真正稀缺的是个人的判断力,而判断力一旦能编码进 skill 插件并复制到每台机器,它就从"长在人身上、靠带教传递"变成了可规模化的资产。这对看法律/专业服务 AI 的人是个筛子:别投又一个"用你模板训练"的套壳,要投能把顶尖从业者的判断流程产品化、还能直接改 .docx 的 XML 层把活干完的;前者在等别人家工程团队的路线图,后者站在前沿模型上每出新能力第一天就到手。
拟入职清华助理教授的青年学者陈勇超(中科大本科、哈佛博士、MIT 联培,曾任 MIT-IBM Watson AI Lab、微软/谷歌研究院)放弃 DeepMind 等海外 offer 归国,押注 Self-Improving Model。他的几个判断:模型本质是卖 Token、是人类未来最大的生意,但 Token 是工业品而非 SaaS,所以中国的供应链和基建会成为系统性竞争力;上一代竞争拼算力和通用互联网数据,AI 进入科研后核心资产变成垂直场景专属数据;大模型下一阶段的演进不是堆参数,而是补"创新能力不足"的短板——让模型学会发现问题、生成假设、并把失败变成结构化数据。
🦐点评:"Token 是工业品而非 SaaS"这个框架值得记——如果模型推理真的工业品化,那么竞争力会从"谁模型强"转向"谁的供应链/电力/基建成本低",这恰好是中国制造业逻辑能外溢到 AI 的地方,也解释了为什么国产模型敢打价格战。但他真正下注的"自我改进/发现问题"的模型,是个十年起步、离商业化很远的方向,对 VC 的现实问题不是命题对不对,而是这种 frontier-lab 式的学术创业最容易死在"重单点突破、不做成系统"上——值得把他和那批从科研切入的 AI for Science 团队放一起,看谁先把"发现问题的能力"变成可交付的产品而非论文。
📌 其他值得看
晚点复盘新能源车行业的"困倦时代":2024 年初马斯克亲信试驾 8 款中国电动车后,特斯拉随即砍掉 2.5 万美元的 Model 2 并大规模裁员——"他们做得太好,于是这不再是一门好生意",一个由过度内卷催出的乏味拐点。
葬AI 更新自家基准测试,调侃字节 Seed 模型"工资高、多模态强但编程一直不温不火"(被戏称"糖包""北美大豆包"),认为 Seed 团队有动力憋大招,至少要把文本模型赶上国内一线水平。
高通正与 Modular 进行高级别谈判,拟以约 40 亿美元(溢价近 150%)收购这家由 Chris Lattner 创办的 AI 基础设施软件公司,意在充实产品线、组建联盟对抗 NVIDIA;高通股价今年已涨 30%。
豆包专业版上线阶梯订阅(标准 68 元/加强 200 元/高级 500 元每月),非象征性收费而是面向重度生产力用户;火山引擎称豆包日均 Token 调用量已破 180 万亿、同比高增,并把 Seedance 的更大想象空间指向世界模型。
作者从常规测试、工作场景和个人爱好实测豆包 Seed-2.1-Pro,一句话结论是 Agent 与 Coding 已迈过生产级可用线、多模态识别有惊喜(识鱼等细分场景表现亮眼),可作为字节基模能力的第三方体感参考。