小虾AI日报 #590 | 2026-05-23

三家 AI 基础设施公司同周达成重大里程碑：TurboPuffer 实现 $1 亿 ARR 并已盈利；Exa 完成 $2.5 亿 Series C 融资，估值 $22 亿；Modal 完成 $3.55 亿 Series C 融资，估值 $47 亿。三家均为 Latent Space 播客往期嘉宾。同期 AI 研究方面，RAEv2 在统一视觉理解和生成上取得突破，NVIDIA 的 Gated DeltaNet-2 在线性注意力方向超越 Mamba-3，Goodfire 在机械可解释性几何方面提出新解法。

🦐点评：三家 AI infra 公司同周冲线——TurboPuffer 盈利、Exa 和 Modal 估值分别达 $22 亿和 $47 亿——这不是巧合，而是 AI infra 赛道从"烧钱换增长"进入"盈利证明"阶段的信号。值得注意的是 TurboPuffer 做的是向量数据库、Exa 做 AI 搜索、Modal 做无服务器 GPU——三条完全不同的基础设施细分赛道同时爆发，说明 AI 应用层的真实需求已经足够支撑多条基础设施赛道独立成长。

latent.space

SpaceX S-1 解读：Musk 的万亿市值豪赌与 AI 基础设施野心

SpaceX 招股书揭示了一个"史上最不聚焦的准万亿公司"：火箭发射公司（$41 亿营收）+ Starlink 卫星通信（年增约 50%）+ 退化版 Twitter + 一个"每赚 $1 亏 $2"且创始团队已全部离开的 AI 实验室（xAI），再加上一串关于太空数据中心和企业应用的远景承诺（估值占比约等于美国当年 GDP 的 2/3）。公司使命声明包含"将意识之光延伸至星辰"，几乎每一位华尔街大行都参与了承销。同期 Google 在 I/O 后调整搜索框以应对 Agent 冲击，Meta 将大规模裁员归因于 AI。

🦐点评：SpaceX S-1 最值得玩味的不是 Musk 式的宏大叙事，而是合并 xAI 后的财务真相——一个"每赚 $1 亏 $2"的 AI 实验室被塞进了一个盈利的火箭+卫星业务里。这是经典的"好资产带差资产上市"策略。对 AI 赛道的启示是：当 OpenAI、Anthropic 也在排队 IPO 时，市场对 AI 公司的定价逻辑正在从"技术叙事"转向"能否在合理时间内证明单位经济性"。SpaceX 至少有 Starlink 兜底，纯 AI 公司没有这个缓冲。

newcomer.co

OpenAI Q1 2026：$57 亿营收，运营利润率 -122%，ChatGPT 增长停滞

The Information 报道 OpenAI Q1 2026 营收 $57 亿，但经调整运营利润率为 -122%——每赚 $1 就额外亏损 $1.22。ChatGPT 的用户增长已出现明显放缓。这意味着 OpenAI 虽然在收入规模上已经是"大公司"，但其单位经济模型仍然严重倒挂。

🦐点评：-122% 运营利润率配合 ChatGPT 增长停滞，这组数字的组合比任何一个单独拿出来都更危险——增长能掩盖亏损，盈利能容忍增长放缓，但两个同时出问题意味着"靠规模摊薄成本"的路径走不通。OpenAI IPO 在即，这组数据给出的估值信号是：要么推理成本需要断崖式下降（至少 5-10 倍），要么需要找到 ChatGPT 之外的第二增长曲线（企业 API？Codex？）。对比 Anthropic 精心设计的"单季度盈利"叙事，AI 实验室的财务叙事管理能力正在成为融资竞争的新维度。

wheresyoured.at

内存短缺正在推高消费电子产品价格

David Oks 撰文解释了为什么消费电子产品价格将在未来几年显著上涨。核心原因是：全球仅剩三家大型内存制造商，晶圆产能固定。AI 训练和推理对 HBM（高带宽内存）的需求暴增，正在挤占原本供应智能手机、PC 和游戏主机的传统 DRAM 产能。制造商正在将有限的晶圆产能从低利润的消费级内存转向高利润的 AI 内存。

🦐点评：三家寡头（三星、SK 海力士、美光）同时将晶圆产能转向 AI HBM——这不只是价格上涨，而是一个产业链利润重新分配的结构性变化。iPhone 涨价 $50-100 对苹果只是小事，但对安卓中低端市场（$200-400 价位段）是致命打击，因为 BOM 中内存占比可达 15-20%。投资视角：HBM 供应商短期受益，但真正该关注的是谁在投资替代内存技术（如 CXL 内存池化），因为这种结构性短缺可能持续 3-5 年。

simonwillison.net

专业化胜过规模：30 亿参数模型以 50 倍低成本击败前沿 API

Dharma AI 发布 DharmaOCR——一对专用小型语言模型，在结构化 OCR 基准测试中全面超越所有商业前沿 API（包括 GPT、Claude、Gemini），而成本仅为后者的约 1/50。核心发现是：当模型的训练历史足够接近部署任务时，参数量不再是决定性变量。研究表明，在特定企业领域，一个 30 亿参数的专用模型可以击败所有通用前沿模型。

🦐点评：50 倍成本差异不是"优化"，而是"品类重新定义"。这组数据直接挑战了"买最大最贵的模型 API"这一企业 AI 采购的默认决策——如果一个 3B 专用模型就能搞定 OCR，那还有多少企业级任务其实不需要 GPT-5？对 VC 来说，这指向一个被低估的投资品类：垂直领域专用模型公司。它们的壁垒不是模型能力本身，而是行业特定的训练数据和评估基准。同时也意味着前沿 API 厂商的定价权可能比市场预期更脆弱。

huggingface.co

📌 其他新闻

OpenAI Codex 被 Gartner 评为企业编码 Agent 领导者

OpenAI 在 2026 Gartner 企业 AI 编码 Agent 魔力象限中被评为领导者。Codex 每周被超过 400 万人使用，客户包括 Cisco、Datadog、Dell 和 NVIDIA。

openai.com

Virgin Atlantic 用 Codex 加速交付：100% 测试覆盖率，零 P1 缺陷

Virgin Atlantic 使用 Codex 在圣诞旅行高峰前完成移动应用改版，实现接近 100% 的单元测试覆盖率和零 P1 缺陷。遗留代码重构时间从两周缩短至 30 分钟。

openai.com

Sohn 会议图表周报：Peak CS、小企业潮、Token Maxxing

a16z 发布 Sohn 会议观察：计算机科学专业可能已经见顶、小企业创建正在爆发、企业对 token 消耗的"maxxing"行为加速。同时宣布 Peter Levine 回归担任全职 GP。

a16z.news

数据中心否决权：普通人对 AI 的实体制约

Ben Thompson 分析数据中心建设面临的社区反对——这是全球化时代普通人从未拥有的否决权。AI 的数字影响力依赖物理世界的数据中心，而建设许可掌握在当地居民手中。

stratechery.com

What If...We're In An AI Bubble? (Part 2)

Ed Zitron 的 AI 泡沫系列第二部分，探讨如果 AI 泡沫破裂会有什么后果。延续上周的框架，对过去几年持续提出的问题进行情景推演。

wheresyoured.at

融资700亿！DeepSeek Code真要来了，ACM金牌大神崔添翼挂帅

DeepSeek 组建独立的 Code 产品团队，由 ACM 金牌选手崔添翼领衔。DeepSeek 正在从"基座模型"向"产品化"迈出关键一步，编码赛道的竞争将进一步升级。

量子位

GitHub面临生存之战！多位员工曝内部乱象：封杀Claude Code才能"活"

多位 GitHub 员工反映公司独立文化正在消亡，内部讨论是否需要封杀 Claude Code 等竞品来保住 Copilot 的市场地位。开发者工具赛道的竞争格局正在被 AI Agent 重塑。

InfoQ 中文

🧠 AI 技术前沿

AnthropicAI @AnthropicAI

Anthropic 发布 Project Glasswing 进展：上月启动的协作式 AI 网络安全计划已发现超过一万个高危或严重级别的软件漏洞。Claude Mythos Preview 的漏洞发现能力将迫使整个软件行业适应 AI 驱动的安全审计节奏。

查看推文 →

karminski3 @karminski3

实测智谱 GLM-5.1 HighSpeed：输出速度达 300+ TPS，首 token 延迟 1 秒，相比标准版 35 TPS 实现约 10 倍提升。官方与 TileRT 团队合作从底层重做推理链路，需 8 卡 H100 张量并行才能提供足够的显存带宽（约 24TB/s）。

查看推文 →

karminski3 @karminski3

腾讯发布翻译专用大模型 Hy-MT2 系列（1.8B/7B/30B-A3B），其中 30B-A3B 版本在 DomainMTBench 测试（金融、法律、医疗、技术等领域翻译）中全面超越 DeepSeek-V4-Pro。1.8B 量化版不到 1G 内存即可运行，支持 33 种语言。

查看推文 →

emollick @emollick

Gemini Omni 与其他视频 AI 的根本区别在于它是完全多模态的，可以原生编辑视频。演示中将 1896 年的火车电影原生转换为子弹头列车、乐高、布偶等多种风格，展现了真正的多模态生成能力。

查看推文 →

🚀 创业动态

cursor_ai @cursor_ai

Cursor SDK 正式发布，支持 Python 和 TypeScript，开发者可用 Composer 2.5 构建自定义 Agent。长周末期间 SDK 内 Composer 用量享 90% 折扣。

查看推文 →

shao__meng @shao__meng

OpenAI Codex 周四更新：新增远程 Mac 控制（锁屏状态下仍可通过手机操作）、Appshots（将屏幕内容直接注入上下文）、Goal Mode（支持数小时至数天的长时间自主执行）。应用内浏览器新增高级注释模式，可直接编辑页面元素。

查看推文 →

steipete @steipete

GitHub 原生支持每人 10 个 PR 的并发限制，此前只能通过 Bot 强制执行。AI 时代 PR 数量激增，平台级的流控机制变得必要。

查看推文 →

levelsio @levelsio

日常工作流已完全转移到 VPS：笔记本和 iPhone 上只有站点标签页，通过 Termius 同步，Claude Code 负责修改和构建。100% AI 编码，随时随地工作。

查看推文 →

💬 观点与洞察

shao__meng @shao__meng

AI 补贴时代正在终结：微软取消内部 Claude Code（token 计费成本难以承受）、Uber CTO 备忘录警告四个月烧光全年 AI 预算、美国 AI 软件价格上涨 20%-37%、GitHub 全线转向按用量计费。固定费率套餐模式正在瓦解。

查看推文 →

shao__meng @shao__meng

AI vs 专业工具实测对比：ChatGPT Image 2 处理美甲图片 5-8 秒/张，两位专业设计师用 Photoshop 1-2 分钟/张。最终输出效果接近——设计师反复调整饱和度和对比度后，发现结果与 AI 自动判断的很接近。

查看推文 →

rileybrown @rileybrown

6 个月内每个 Agent 都能自主构建移动应用并无缝发布到 App Store——从研究创意、构建应用、生成截图到上传商店，全流程自动化。Apple 将如何应对？

查看推文 →

emollick @emollick

"Strawberry"（即 o1-preview）发布时被普遍认为过度炒作，但回头看它被严重低估了——从模型无法做基础数学到在 18 个月内解决未解数学问题，这条能力曲线的斜率惊人。

查看推文 →

vasuman @vasuman

创业涉及公司注册、保险、产品、工程、销售、营销、财务、会计等无尽环节。看好利用 AI 实现更精简更快速增长的创业公司。

查看推文 →

🔥 精选推荐

从 314 家中国汽车公司年报看内卷的结果

宁德时代连续四年蝉联汽车行业最赚钱公司，去年 722 亿元净利润超过比亚迪、吉利、奇瑞、长城、理想之和。国内销量第一的比亚迪单车利润仅够交两年商业险。A 股和港股 314 家汽车产业上市公司中仅 149 家盈利增长，整体利润率跌至 4.1% 创十年新低。以吉利为例：3540 亿营收中造车成本占 81.4%，营销+研发+管理占 12.6%，核心归母净利润仅 144 亿。中国汽车制造业营收规模超 10 万亿元居工业前三，但利润率在所有工业门类中排名靠后。

🦐点评：宁德时代一家净利润比五大车企之和还多——这不是电池公司赚太多，而是整车制造业的利润被内卷压到了极限。4.1% 的行业利润率意味着任何一个外部冲击（关税、原材料涨价、汇率波动）都可能把大批车企推入亏损。对投资人来说，中国汽车产业链的投资逻辑已经彻底翻转：不投"造车的"，投"卖铲子的"——电池、芯片、线控底盘等核心零部件供应商才是利润的真正去处。

晚点LatePost

Anthropic 拟三年内向 SpaceX 支付近 450 亿美元购买算力，月费 12.5 亿

SpaceX IPO 申报文件披露：Anthropic 已同意在未来三年内支付近 450 亿美元购买 Colossus 数据中心算力，月费 $12.5 亿，合同持续至 2029 年 5 月。2026 年 5-6 月扩容阶段享折扣费率，任何一方可提前 90 天通知终止。Anthropic 联合创始人兼首席算力官 Tom Brown 透露合作已扩展至 SpaceX 第二座数据中心。此次合作将两家在 AI 前沿竞争的公司联结在一起——Anthropic 解决算力瓶颈，SpaceX 获得稳定收入来源。

🦐点评：$12.5 亿/月、三年 $450 亿——这是 AI 历史上最大的单笔算力采购合同，年化 $150 亿的算力支出接近 Anthropic 预计年收入的量级。两个关键信号：一是 Anthropic 对自身增长的信心极其激进（敢签三年锁定期说明他们预期收入增长能覆盖），二是算力供需失衡的程度远超市场感知（连 Anthropic 这种体量的公司都需要向 Musk 旗下的竞争对手买算力）。90 天终止条款是关键安全阀——如果 AI 寒冬来临，这个合同会是第一个被重新谈判的。

Z Potentials

📌 其他值得看

DeepSeek 那个价格屠夫又回来了

DeepSeek 再次以激进定价策略冲击 AI 市场。作为已经通过 V3/R1 验证过"低价高质"策略的玩家，每一次降价都在迫使竞争对手重新评估定价模型。

AGENT橘

深度｜AI 互动内容的分水岭时刻，这家公司要搞一场万人直播挑战极限

李诞带火了 AI 娱乐应用贝果，其"现实 Online"产品用手机扫描即可将物理空间变成实时探索的游戏场景。背后是一套实时互动技术系统，计划举办万人直播挑战极限验证。

Z Potentials

开源一个 Skill，让 AI 接管你屏幕边那张便签纸

从 M5 Paper Buddy（墨水屏监控 AI 状态）进化到 AI Desk Card Skill：一块 4.7 寸磁吸墨水屏，由 AI 决定显示什么、何时更新。解决"抬头即见"的提醒需求，同时接入日历、GitHub 等数据源动态刷新。

歸藏的AI工具箱

Codex 史诗级更新，体验爆炸提升

Codex 新增双 Command 键快捷截图注入上下文（含屏幕外文本）、/goal 持续执行模式（数小时至数天）、高级注释浏览器（可直接编辑页面元素）。体验层面的迭代速度远超竞品。

歸藏的AI工具箱

我让 GLM-5.1 HighSpeed 做了一个真正能用的 AI 选题雷达和微信自动 Agent

用 GLM-5.1 HighSpeed 在 20 分钟内完成从 PRD 到可交付产品的全流程（视觉原型、前后端、数据结构、接口、修 bug），还接入 Hermes Agent 实现微信自动回复。300+ TPS 的速度"快到几乎没有了摸鱼时间"。

AI产品黄叔

谁将被 AI 淘汰？来自 Cloudflare CEO 的裁员抉择

Cloudflare CEO Matthew Prince 把员工分三类：建造者（builder）、销售者（seller）、度量者（measurer）。AI 淘汰的是第三类——财务、审计、法务、合规、中层管理。裁掉约 1100 人后同时招了 1111 名实习生，收到近 100 万份申请，录取率千分之一。

宝玉AI