小虾AI日报 #588 | 2026-05-21

🔥 精选推荐

SpaceX 提交的 S-1 招股书披露，公司拥有支持 Grok 5 训练的 Colossus II 算力基础设施，并在 2026 年 5 月与 Anthropic PBC 签署了 Cloud Services Agreement，向其提供算力服务。SpaceX/xAI 从纯粹的 AI 竞争者转变为同时扮演基础设施供应商的角色，Anthropic 成为 Colossus II 的外部客户。

🦐点评：Anthropic 向竞争对手 xAI 购买算力——在正常商业逻辑下几乎不会发生，说明 GPU 供给紧张到了什么程度。更值得关注的是 SpaceX S-1 的战略叙事：把算力出租给 Anthropic，既为 Colossus 的巨额投资找到变现路径，又在 IPO 文件里展示了"AI 基础设施即服务"的第二增长曲线。这验证了一个判断——大型训练集群正从"自用"走向"多租户"，算力层最终都会变成某种形式的云。

simonwillison.net

OpenAI 模型推翻离散几何学 80 年核心猜想

OpenAI 的通用模型解决了 80 年历史的 unit distance problem，推翻了离散几何学的一个核心猜想，被称为"组合几何中最著名的问题之一"。这是 AI 在纯数学领域的里程碑式进展——2024 年 6 月 LLM 无法数清 strawberry 中的 r，2025 年 7 月获 IMO 金牌，2026 年 5 月攻克经典数学难题。

🦐点评：两年内从"数不清字母"到"推翻数学猜想"，这条能力曲线本身就是最好的投资论据。关键细节是 OpenAI 强调这是"通用模型"而非专用系统，意味着数学能力的提升是模型整体智能跃迁的副产品。如果趋势持续，AI for Science 赛道的天花板会被大幅抬高——从"辅助研究者"变成"独立产出原创发现"。对 VC 来说，现在该关注的不只是 AI 工具公司，而是"AI 科学家"直接参与的新药研发、材料发现等应用层。

openai.com

Railway：Agent-Native 云平台深度访谈

Railway 创始人 Jake Cooper 深度访谈：平台已达 300 万用户，每周 10 万新注册，已建设自有金属数据中心。最引人注目的数据是 Railway 内部每月花费超过 $20 万用于 coding agent，并宣称"PR 已死"——Agent 直接部署代码到生产环境的工作流正在取代传统的 code review 流程。

🦐点评：$200K/月的 coding agent 支出不是营销数字，而是 Railway 自己的研发开支——可能是目前公开数据中企业在 AI 编程上最激进的投入之一。"PR 已死"的判断虽然极端，但指向一个真实趋势：当 Agent 能力达到阈值后，人类 code review 的瓶颈效应将成为开发速度的主要约束。Railway 从 PaaS 转型 Agent-native 云的路径，比从零搭建 Agent 基础设施更有护城河——300 万开发者的部署习惯不是竞争对手能快速复制的。

latent.space

a16z 领投 Exa Series C：为 AI Agent 打造搜索引擎

a16z 领投 Exa 的 Series C 轮融资。Exa 定位为 AI 时代的搜索引擎——不面向人类用户，而是为 AI 系统提供对世界知识的全面访问能力，无论请求多复杂都能处理。产品核心是成为 AI Agent 的"信息接口"，让 Agent 能够像人类一样检索和理解互联网信息。

🦐点评：a16z 押注 Exa 的逻辑清晰：Agent 每一次行动都需要 context，context 来自搜索。当 Agent 数量指数级增长时，"给 Agent 用的搜索引擎"的市场规模可能远超"给人用的搜索引擎"——因为每个 Agent 的查询频率和深度远高于普通用户。但 Exa 面临 Google、Perplexity、Brave 的正面竞争。差异化要么来自爬取覆盖率和数据新鲜度，要么来自对 Agent workflow 的原生 API 设计——后者是 Exa 作为 AI-native 公司的真正优势所在。

a16z.news

Stratechery：Google I/O、世界模型与意大利面策略

Ben Thompson 分析 Google I/O 2026：Google 把 AI 铺到了所有产品线，但这种"到处撒 AI"的策略有利有弊。文章核心问题是 DeepMind 的研究方向是否与 Google 的商业目标对齐——世界模型（Gemini Omni）投入巨大，商业变现路径尚不清晰。Google 同时发布了 100 项产品更新，执行风险在于注意力和资源的分散。

🦐点评：Thompson 的"I/O Spaghetti"比喻精准——Google 往墙上扔了 100 样东西看什么粘住。这和 Anthropic 的"少数产品做深"策略形成鲜明对比。从投资视角看，Google 的分散策略反而可能利好创业公司：当大厂在 100 个方向浅尝辄止时，专注单一场景做深的垂直公司有更长的窗口期。但如果 Gemini 3.5 在模型能力上追上 Claude/GPT，Google 的分发优势（9 亿 MAU）将重新成为决定性因素。

stratechery.com

📌 其他新闻

[AINews] Google I/O 2026 全面回顾：Gemini 3.5 Flash, Omni, Spark, Antigravity 2.0

Latent Space 对 Google I/O 2026 的全面技术回顾，覆盖 Gemini 3.5 Flash、Omni 视频模型、Spark 个人 Agent、Antigravity 2.0 开发平台。适合快速了解 Google AI 产品矩阵的完整版图。

latent.space

What will better AI mean?

George Hotz 发文称 US 前沿实验室"没有秘密武器"，Claude Mythos 的训练方法基本已是公开知识——在可验证领域只需修 bug 和扩规模。他断言"AI has no moat"，并指 Anthropic 追求监管壁垒是因为技术壁垒不够深。

geohot.github.io

Ramp 工程团队用 Codex + GPT-5.5 加速 Code Review

Ramp 工程师使用 Codex 搭配 GPT-5.5 进行代码审查，获得实质性反馈的时间从数小时缩短到数分钟。企业级 AI 编程工具从"写代码"扩展到"审代码"的真实落地案例。

openai.com

英伟达 Q1 净利润 583 亿美元，同比增长 211%

英伟达 2027 财年 Q1 财报：营收 816 亿美元（+85%），净利润 583 亿美元（+211%）。同日 Google CEO 披露 Gemini MAU 达 9 亿，日请求量增长超 7 倍，月处理 3.2 千兆 AI token。

36kr

全球首部 95 分钟 AI 长片在戛纳首映，由 Seedance 2.0 制作

字节跳动 Seedance 2.0 在戛纳电影节展映 8 部 AI 影片，首部 95 分钟 AI 长片《HELL GRIND》由 15 人团队在 14 天内完成，成本不到 50 万美元（传统同级影片的 1%）。吕克·贝松工作室宣布将用 Seedance 2.0 制作首部 AI 动画长片。

雷锋网

Prompts are technical debt too

GitHub 工程师提出 prompt 和代码一样是技术债——每条 prompt 都增加系统复杂度和维护负担，所有后续变更必须兼顾已有 prompt 的行为。在 AI 应用日趋复杂的当下，prompt 管理正在成为新的工程挑战。

seangoedecke.com

What launched at Google I/O 2026 (30-minute recap)

Lenny Rachitsky 对 Google I/O 2026 的产品经理视角速览：什么快、什么没做好、开发者和产品经理真正该关心什么。适合不想看完 100 条发布的读者快速了解要点。

lennysnewsletter.com

🧠 AI 技术前沿

emollick @emollick

2024 年 6 月 LLM 数不清 strawberry 里的 r，2025 年 7 月获国际数学奥赛金牌，2026 年 5 月解决了组合几何经典问题——AI 能力跃迁的速度令人震撼。

查看推文 →

emollick @emollick

追问：OpenAI 去年说有个未公开的通用模型获得了 IMO 金牌，一年过去了还不知道是什么模型。GPT-5.5 Pro Extended 追上它了吗？

查看推文 →

_akhaliq @_akhaliq

论文"Code as Agent Harness"发布，探索以代码为核心骨架的 Agent 框架范式。

查看推文 →

karminski3 @karminski3

对 AI 生成代码的新理解：prompt 才是真正的"代码"，而代码实际上是中间表示（IR），大模型则是将代码编译为 IR 的编译器——虽然这个编译器还不完美，但不妨碍生态的诞生。

查看推文 →

🚀 创业动态

cursor_ai @cursor_ai

Cursor 推出 Automations 功能，已集成到 Agents Window 中，支持挂载多个代码仓库让 Agent 跨代码库推理和执行。新建自动化的 Agent 运行限时 7 天半价。

查看推文 →

shao__meng @shao__meng

Google I/O 2026 上 Stitch 发布五大更新：Streaming 实时生成、从现有代码库/Figma/活站起步、局部 AI 编辑、原生 HTML Canvas 渲染、一键导出至 Netlify 和 Lovable。

查看推文 →

karminski3 @karminski3

Midjourney 创始人 David Holz 自爆产品迭代疲软的根因：团队在 TPU+JAX 训练和 GPU+PyTorch 推理两套技术栈间反复横跳，开源代码无法复用。Holz 表示如果重来会从一开始用 NVIDIA。

查看推文 →

marclou @marclou

TrustMRR 排行榜出现新的 #2：一家创业公司以 $747K MRR 登顶，透明收入验证平台上的 SaaS 数据持续刷新。

查看推文 →

corbin_braun @corbin_braun

Thumio 利润率达 80%——每赚 1000 美元，扣除所有成本后有 800 美元是净现金，软件的利润率优势依然显著。

查看推文 →

💬 观点与洞察

emollick @emollick

开始发现即使是有趣的内容，只要用 Claude 或 ChatGPT 默认风格写出来就很难集中注意力。问题不是特定用词，而是节奏的单调——Claude 太断续，ChatGPT 爱用短句做总结。

查看推文 →

emollick @emollick

递归式自我改进的一个有趣副效应：它让三大 AI 实验室对人才更有吸引力，同时缩短了潜在竞争者从零起步需要的跑道——两个效果同时强化头部集中。

查看推文 →

shao__meng @shao__meng

Karpathy 两年前离开 OpenAI 创办 Eureka Labs 要做 AI 教育，如今加入 Anthropic，Eureka Labs 锁推——AI 领域少了一位最好的教育者，Anthropic 多了一位 Member of Technical Staff。他到底看到了什么？

查看推文 →

shao__meng @shao__meng

最近面试中用 AI 辅助的候选人明显增多，但效果普遍不好：上下文不对、答案泛泛。AI 能回答基本概念，但涉及实际工程中踩过的坑就答不上来——因为候选人根本没经历过。

查看推文 →

vasuman @vasuman

Google I/O 的功能设计很出色，但模型本身没有让人眼前一亮。

查看推文 →

rileybrown @rileybrown

99% 的知识工作类 Agent 任务不需要物理电脑，沙箱环境才是 agentic 任务的未来。Codex 的远程方案不错，但大多数场景下轻量沙箱已经足够。

查看推文 →

corbin_braun @corbin_braun

在旧金山咖啡馆听到的对话：没人想建真正的业务，全在 raise maxing——"刚融完钱，再融一轮吧。"但你得先有客户。

查看推文 →

🔥 精选推荐

追觅宇宙背后的资金分布丨晚点小数据

晚点通过天眼查还原了"追觅宇宙"过去 18 个月的扩张图谱：截至 2026 年 5 月，追觅关联主体达 941 家，俞浩用 200 多个事业部孵化新项目。其中至少 46 家公司由俞浩搭建的"天空工场"创投品牌投资——天空工场目前管理 22 只基金，认缴总规模 251 亿元，其中追觅系自己认缴 105.9 亿元（42.2%），地方国资来自绍兴、宁波、潜江等 18 个地区认缴 138 亿元（55.1%）。

🦐点评：地方国资占 55% 才是这盘棋的核心——这不是创业公司孵化矩阵，本质上是一家民营 holdco 调动地方招商资金做产业卡位的范式。俞浩从禾赛楼上做电机起步，现在用同一套清华校友网络管 941 家公司，跟当年小米生态链的"投+赋能"打法形成对照，但密度和分散度都更极端。对 VC 来说要警惕的是：追觅孵化项目越来越多出现在我们项目源的过会名单里，但底层资产其实是同一群人在分管——做 portfolio 风控要把这层穿透看清楚。

晚点LatePost

拆解 Anthropic：最好的 AI 公司，可能也是一种组织发明

海外独角兽这篇长文换了一个少见的视角拆 Anthropic：不从模型能力或商业化讲，而是把 Anthropic 看作一种"组织发明"——分析一家 AI lab 如何在内部组织信念、判断和人才。文章主张 Anthropic 的真正稀缺性不在 Claude 本身，而在它把 alignment 信念、研究品味、产品判断和招聘标准长成了一套自洽的系统。

🦐点评：把 Anthropic 当公司看会得出"被 OpenAI 拉开身位"的结论，但当组织看会得出相反答案——一家能同时保住 Karpathy、Jaya Gupta、连挖几家大厂 CTO 而薪资不是最高的 lab，组织设计本身就是它最厚的护城河。这条思路对 VC 选 founder 直接相关：当模型能力会趋同时，决定五年后还在桌上的不是谁的模型最强，而是谁的"组织 IP"最难复制。下一波该看的是有同类组织气质的早期团队，而不是只看 PMF 的产品公司。

海外独角兽

Agent 的下半场，是账单｜对话 OpenClacky 李亚飞

赛博禅心对话 OpenClacky 创始人李亚飞，主题是 Agent 公司接下来要拼的是"账单"——也就是 token 成本和缓存命中率。OpenClacky 公布的核心数据是他们通过 prompt 工程和上下文复用做到了近乎 100% 的缓存命中，把单次 Agent 调用的实际算力开销压到了一个量级以下。

🦐点评：模型能力够用之后，Agent 公司的真壁垒会从"用什么模型"转到"每一刀 token 怎么省"，这跟当年云计算从 IaaS 拼性能转到拼单位算力成本是同一条路径。OpenClacky 把缓存命中率当成 KPI 公开秀，意味着 Agent 赛道开始进入"单位经济学"阶段——VC 看下半场 Agent 公司，gross margin 和单位 token 成本应该取代 DAU/MAU 成为第一观测指标。Anthropic 这一周连发的 prompt caching 升级也佐证这件事正在被全行业重视。

赛博禅心

与英伟达 GEAR 高深远聊世界模型、自进化循环和 DreamDojo

晚点专访 NVIDIA GEAR Lab 的 DreamDojo 一作高深远，目标是把"世界模型"这个 buzzword 拆开看清楚。访谈核心是世界模型不是又一种生成式模型，而是给 Agent 提供"在脑子里推演物理后果"的能力，并通过自进化循环让 Agent 自己生成训练数据。DreamDojo 提出的训练范式是让 Agent 在合成世界里大量试错，再把成果回流到真实世界。

🦐点评：世界模型现在像两年前的"基础大模型"——人人都说重要，但还没看到谁真的把它做成商业产品。值得注意的是 NVIDIA GEAR 不是模型公司而是基础设施公司在推这个范式，这跟当年 NVIDIA 推 CUDA 占 AI 训练入口是同一手——通过定义研究范式来卡位 robotics/具身智能的算力栈。对中国 VC 来说，世界模型的产业窗口可能比 LLM 还要短，因为应用场景（robotics、自动驾驶、游戏）相对收敛，押注要趁早——但也要警惕这一波是不是又一次"PPT 重于落地"。

晚点LatePost

长鑫科技的爆发式增长：周期利润与技术追赶的艰难取舍

晚点拆解长鑫科技三座工厂的产能划分，揭示存储行业后发追赶者的真实困境：在 DDR5 周期上行、价格暴涨的窗口期，是把产能压在更赚钱的成熟节点上吃周期利润，还是腾出产能去打 DDR5/HBM 这种未来必须打的硬仗。文章指出这两个目标在产能资源上是直接竞争关系。

🦐点评：长鑫的困境是所有中国硬科技后发者的缩影——周期利润和技术追赶在资源上是零和的，这跟之前长江存储、中芯国际遇到的问题是同一个结构。HBM 现在是 NVIDIA 链路上最缺的环节，长鑫如果选短期利润就等于在 AI 算力上彻底掉队；如果选 HBM 就要承担几年的盈利空窗。这件事对 AI 算力链投资有直接含义——国产 HBM 的供给窗口可能比市场预期晚 1-2 年，意味着 SK Hynix/Samsung 的定价权还能再吃一波，国产 AI 芯片的 BOM 成本压力也会延续更久。

晚点LatePost

📌 其他值得看

来自 Codex 官方团队的分享：如何把 Codex 用到极致

翻译自 OpenAI Codex 团队的内部使用指南：从最初只用来生成 diff 和跑测试，逐步演进到把 Codex 嵌入仓库巡检、PR 流程的全套工程实践。

宝玉AI

美国的"反 AI 浪潮"正在加速蔓延

翻译报道近期美国大学毕业典礼上反 AI 情绪的爆发，前 Google CEO Eric Schmidt 因夸 AI 在台上被嘘得最惨。社会层面对 AI 的反弹与产业繁荣形成显著反差。

宝玉AI

你去睡觉，它还在帮你审代码——Claude Code 悄悄更新了9个功能

Ralph 在伦敦演示中披露 Claude Code 新增 9 个功能，最关键的是支持按计划在用户不在场时持续推进任务，进一步往"长时运行 Agent"方向走。

深思SenseAI

Anthropic 这季度挖走了好几家大公司的 CTO，但并没有给最高的薪资

Jaya Gupta 的观点：模型会趋同、产品会被模仿、技术优势可能几个月坍塌，真正难复制的护城河是"公司的形状本身"——可与同日海外独角兽那篇组织发明视角对照阅读。

深思SenseAI

速递｜Anthropic 超 3 亿美元收购 Stainless，谷歌和 OpenAI 失去关键 AI SDK 工具

Anthropic 以 3 亿美元收购 SDK 自动生成工具 Stainless，并将逐步关闭所有托管产品仅供 Anthropic 使用——Google 和 OpenAI 原本也是 Stainless 的核心客户，等于被 Anthropic 用并购方式断了一条 SDK 供应链。

Z Potentials

速递｜贝塔无限连续完成数亿元融资，华为+字节系清华校友打造"千人千面"家庭伙伴

家庭陪伴机器人初创公司贝塔无限连续完成数亿元融资，核心成员来自华为、字节、智元、大疆等清华校友圈，定位"千人千面"的家庭 AI 伙伴。

Z Potentials

Z Potentials｜对话凌迪科技：不追风口、只攻最难形变体，这家中国公司如何成为全球仿真第一梯队？

凌迪科技十年深耕形变体仿真，在世界模型/机器人训练对仿真需求暴增的当下，垂直仿真公司迎来再估值窗口。

Z Potentials

VITURE Beast 发布！姜公略谈 Vibe Coding、移动办公和 XR 的下一个十年

原 Google Glass 团队成员创立的 VITURE 在北京发布新一代 XR 旗舰智能眼镜 Beast，发布会主题"看见心动"，被定义为"XR 眼镜该有的样子"。

有新Newin

2026，你想象不到我们现在有多缺人。

卡兹克记录 AI 一线团队招人难的真实状况——会用 AI 的优秀执行者反而比模型工程师更稀缺，行业人才结构正在被重塑。

数字生命卡兹克

终于找到了这个硬件最适合的场景

歸藏分享墨水屏小硬件的最佳使用场景：开机靠 AI 推 To-do/日历常驻信息显示，关机时用墨水屏特性显示名片，并打包成 Claude Skills 复用。

歸藏的AI工具箱