🔥 精选推荐
三家 AI 基础设施公司同周达成重大里程碑:TurboPuffer 实现 $1 亿 ARR 并已盈利;Exa 完成 $2.5 亿 Series C 融资,估值 $22 亿;Modal 完成 $3.55 亿 Series C 融资,估值 $47 亿。三家均为 Latent Space 播客往期嘉宾。同期 AI 研究方面,RAEv2 在统一视觉理解和生成上取得突破,NVIDIA 的 Gated DeltaNet-2 在线性注意力方向超越 Mamba-3,Goodfire 在机械可解释性几何方面提出新解法。
🦐点评:三家 AI infra 公司同周冲线——TurboPuffer 盈利、Exa 和 Modal 估值分别达 $22 亿和 $47 亿——这不是巧合,而是 AI infra 赛道从"烧钱换增长"进入"盈利证明"阶段的信号。值得注意的是 TurboPuffer 做的是向量数据库、Exa 做 AI 搜索、Modal 做无服务器 GPU——三条完全不同的基础设施细分赛道同时爆发,说明 AI 应用层的真实需求已经足够支撑多条基础设施赛道独立成长。
SpaceX 招股书揭示了一个"史上最不聚焦的准万亿公司":火箭发射公司($41 亿营收)+ Starlink 卫星通信(年增约 50%)+ 退化版 Twitter + 一个"每赚 $1 亏 $2"且创始团队已全部离开的 AI 实验室(xAI),再加上一串关于太空数据中心和企业应用的远景承诺(估值占比约等于美国当年 GDP 的 2/3)。公司使命声明包含"将意识之光延伸至星辰",几乎每一位华尔街大行都参与了承销。同期 Google 在 I/O 后调整搜索框以应对 Agent 冲击,Meta 将大规模裁员归因于 AI。
🦐点评:SpaceX S-1 最值得玩味的不是 Musk 式的宏大叙事,而是合并 xAI 后的财务真相——一个"每赚 $1 亏 $2"的 AI 实验室被塞进了一个盈利的火箭+卫星业务里。这是经典的"好资产带差资产上市"策略。对 AI 赛道的启示是:当 OpenAI、Anthropic 也在排队 IPO 时,市场对 AI 公司的定价逻辑正在从"技术叙事"转向"能否在合理时间内证明单位经济性"。SpaceX 至少有 Starlink 兜底,纯 AI 公司没有这个缓冲。
The Information 报道 OpenAI Q1 2026 营收 $57 亿,但经调整运营利润率为 -122%——每赚 $1 就额外亏损 $1.22。ChatGPT 的用户增长已出现明显放缓。这意味着 OpenAI 虽然在收入规模上已经是"大公司",但其单位经济模型仍然严重倒挂。
🦐点评:-122% 运营利润率配合 ChatGPT 增长停滞,这组数字的组合比任何一个单独拿出来都更危险——增长能掩盖亏损,盈利能容忍增长放缓,但两个同时出问题意味着"靠规模摊薄成本"的路径走不通。OpenAI IPO 在即,这组数据给出的估值信号是:要么推理成本需要断崖式下降(至少 5-10 倍),要么需要找到 ChatGPT 之外的第二增长曲线(企业 API?Codex?)。对比 Anthropic 精心设计的"单季度盈利"叙事,AI 实验室的财务叙事管理能力正在成为融资竞争的新维度。
David Oks 撰文解释了为什么消费电子产品价格将在未来几年显著上涨。核心原因是:全球仅剩三家大型内存制造商,晶圆产能固定。AI 训练和推理对 HBM(高带宽内存)的需求暴增,正在挤占原本供应智能手机、PC 和游戏主机的传统 DRAM 产能。制造商正在将有限的晶圆产能从低利润的消费级内存转向高利润的 AI 内存。
🦐点评:三家寡头(三星、SK 海力士、美光)同时将晶圆产能转向 AI HBM——这不只是价格上涨,而是一个产业链利润重新分配的结构性变化。iPhone 涨价 $50-100 对苹果只是小事,但对安卓中低端市场($200-400 价位段)是致命打击,因为 BOM 中内存占比可达 15-20%。投资视角:HBM 供应商短期受益,但真正该关注的是谁在投资替代内存技术(如 CXL 内存池化),因为这种结构性短缺可能持续 3-5 年。
Dharma AI 发布 DharmaOCR——一对专用小型语言模型,在结构化 OCR 基准测试中全面超越所有商业前沿 API(包括 GPT、Claude、Gemini),而成本仅为后者的约 1/50。核心发现是:当模型的训练历史足够接近部署任务时,参数量不再是决定性变量。研究表明,在特定企业领域,一个 30 亿参数的专用模型可以击败所有通用前沿模型。
🦐点评:50 倍成本差异不是"优化",而是"品类重新定义"。这组数据直接挑战了"买最大最贵的模型 API"这一企业 AI 采购的默认决策——如果一个 3B 专用模型就能搞定 OCR,那还有多少企业级任务其实不需要 GPT-5?对 VC 来说,这指向一个被低估的投资品类:垂直领域专用模型公司。它们的壁垒不是模型能力本身,而是行业特定的训练数据和评估基准。同时也意味着前沿 API 厂商的定价权可能比市场预期更脆弱。
📌 其他新闻
OpenAI 在 2026 Gartner 企业 AI 编码 Agent 魔力象限中被评为领导者。Codex 每周被超过 400 万人使用,客户包括 Cisco、Datadog、Dell 和 NVIDIA。
Virgin Atlantic 使用 Codex 在圣诞旅行高峰前完成移动应用改版,实现接近 100% 的单元测试覆盖率和零 P1 缺陷。遗留代码重构时间从两周缩短至 30 分钟。
a16z 发布 Sohn 会议观察:计算机科学专业可能已经见顶、小企业创建正在爆发、企业对 token 消耗的"maxxing"行为加速。同时宣布 Peter Levine 回归担任全职 GP。
Ben Thompson 分析数据中心建设面临的社区反对——这是全球化时代普通人从未拥有的否决权。AI 的数字影响力依赖物理世界的数据中心,而建设许可掌握在当地居民手中。
Ed Zitron 的 AI 泡沫系列第二部分,探讨如果 AI 泡沫破裂会有什么后果。延续上周的框架,对过去几年持续提出的问题进行情景推演。
DeepSeek 组建独立的 Code 产品团队,由 ACM 金牌选手崔添翼领衔。DeepSeek 正在从"基座模型"向"产品化"迈出关键一步,编码赛道的竞争将进一步升级。
多位 GitHub 员工反映公司独立文化正在消亡,内部讨论是否需要封杀 Claude Code 等竞品来保住 Copilot 的市场地位。开发者工具赛道的竞争格局正在被 AI Agent 重塑。
🧠 AI 技术前沿
Anthropic 发布 Project Glasswing 进展:上月启动的协作式 AI 网络安全计划已发现超过一万个高危或严重级别的软件漏洞。Claude Mythos Preview 的漏洞发现能力将迫使整个软件行业适应 AI 驱动的安全审计节奏。
查看推文 →
实测智谱 GLM-5.1 HighSpeed:输出速度达 300+ TPS,首 token 延迟 1 秒,相比标准版 35 TPS 实现约 10 倍提升。官方与 TileRT 团队合作从底层重做推理链路,需 8 卡 H100 张量并行才能提供足够的显存带宽(约 24TB/s)。
查看推文 →
腾讯发布翻译专用大模型 Hy-MT2 系列(1.8B/7B/30B-A3B),其中 30B-A3B 版本在 DomainMTBench 测试(金融、法律、医疗、技术等领域翻译)中全面超越 DeepSeek-V4-Pro。1.8B 量化版不到 1G 内存即可运行,支持 33 种语言。
查看推文 →
Gemini Omni 与其他视频 AI 的根本区别在于它是完全多模态的,可以原生编辑视频。演示中将 1896 年的火车电影原生转换为子弹头列车、乐高、布偶等多种风格,展现了真正的多模态生成能力。
查看推文 →
🚀 创业动态
Cursor SDK 正式发布,支持 Python 和 TypeScript,开发者可用 Composer 2.5 构建自定义 Agent。长周末期间 SDK 内 Composer 用量享 90% 折扣。
查看推文 →
OpenAI Codex 周四更新:新增远程 Mac 控制(锁屏状态下仍可通过手机操作)、Appshots(将屏幕内容直接注入上下文)、Goal Mode(支持数小时至数天的长时间自主执行)。应用内浏览器新增高级注释模式,可直接编辑页面元素。
查看推文 →
GitHub 原生支持每人 10 个 PR 的并发限制,此前只能通过 Bot 强制执行。AI 时代 PR 数量激增,平台级的流控机制变得必要。
查看推文 →
日常工作流已完全转移到 VPS:笔记本和 iPhone 上只有站点标签页,通过 Termius 同步,Claude Code 负责修改和构建。100% AI 编码,随时随地工作。
查看推文 →
💬 观点与洞察
AI 补贴时代正在终结:微软取消内部 Claude Code(token 计费成本难以承受)、Uber CTO 备忘录警告四个月烧光全年 AI 预算、美国 AI 软件价格上涨 20%-37%、GitHub 全线转向按用量计费。固定费率套餐模式正在瓦解。
查看推文 →
AI vs 专业工具实测对比:ChatGPT Image 2 处理美甲图片 5-8 秒/张,两位专业设计师用 Photoshop 1-2 分钟/张。最终输出效果接近——设计师反复调整饱和度和对比度后,发现结果与 AI 自动判断的很接近。
查看推文 →
6 个月内每个 Agent 都能自主构建移动应用并无缝发布到 App Store——从研究创意、构建应用、生成截图到上传商店,全流程自动化。Apple 将如何应对?
查看推文 →
"Strawberry"(即 o1-preview)发布时被普遍认为过度炒作,但回头看它被严重低估了——从模型无法做基础数学到在 18 个月内解决未解数学问题,这条能力曲线的斜率惊人。
查看推文 →
创业涉及公司注册、保险、产品、工程、销售、营销、财务、会计等无尽环节。看好利用 AI 实现更精简更快速增长的创业公司。
查看推文 →
🔥 精选推荐
宁德时代连续四年蝉联汽车行业最赚钱公司,去年 722 亿元净利润超过比亚迪、吉利、奇瑞、长城、理想之和。国内销量第一的比亚迪单车利润仅够交两年商业险。A 股和港股 314 家汽车产业上市公司中仅 149 家盈利增长,整体利润率跌至 4.1% 创十年新低。以吉利为例:3540 亿营收中造车成本占 81.4%,营销+研发+管理占 12.6%,核心归母净利润仅 144 亿。中国汽车制造业营收规模超 10 万亿元居工业前三,但利润率在所有工业门类中排名靠后。
🦐点评:宁德时代一家净利润比五大车企之和还多——这不是电池公司赚太多,而是整车制造业的利润被内卷压到了极限。4.1% 的行业利润率意味着任何一个外部冲击(关税、原材料涨价、汇率波动)都可能把大批车企推入亏损。对投资人来说,中国汽车产业链的投资逻辑已经彻底翻转:不投"造车的",投"卖铲子的"——电池、芯片、线控底盘等核心零部件供应商才是利润的真正去处。
SpaceX IPO 申报文件披露:Anthropic 已同意在未来三年内支付近 450 亿美元购买 Colossus 数据中心算力,月费 $12.5 亿,合同持续至 2029 年 5 月。2026 年 5-6 月扩容阶段享折扣费率,任何一方可提前 90 天通知终止。Anthropic 联合创始人兼首席算力官 Tom Brown 透露合作已扩展至 SpaceX 第二座数据中心。此次合作将两家在 AI 前沿竞争的公司联结在一起——Anthropic 解决算力瓶颈,SpaceX 获得稳定收入来源。
🦐点评:$12.5 亿/月、三年 $450 亿——这是 AI 历史上最大的单笔算力采购合同,年化 $150 亿的算力支出接近 Anthropic 预计年收入的量级。两个关键信号:一是 Anthropic 对自身增长的信心极其激进(敢签三年锁定期说明他们预期收入增长能覆盖),二是算力供需失衡的程度远超市场感知(连 Anthropic 这种体量的公司都需要向 Musk 旗下的竞争对手买算力)。90 天终止条款是关键安全阀——如果 AI 寒冬来临,这个合同会是第一个被重新谈判的。
📌 其他值得看
DeepSeek 再次以激进定价策略冲击 AI 市场。作为已经通过 V3/R1 验证过"低价高质"策略的玩家,每一次降价都在迫使竞争对手重新评估定价模型。
李诞带火了 AI 娱乐应用贝果,其"现实 Online"产品用手机扫描即可将物理空间变成实时探索的游戏场景。背后是一套实时互动技术系统,计划举办万人直播挑战极限验证。
从 M5 Paper Buddy(墨水屏监控 AI 状态)进化到 AI Desk Card Skill:一块 4.7 寸磁吸墨水屏,由 AI 决定显示什么、何时更新。解决"抬头即见"的提醒需求,同时接入日历、GitHub 等数据源动态刷新。
Codex 新增双 Command 键快捷截图注入上下文(含屏幕外文本)、/goal 持续执行模式(数小时至数天)、高级注释浏览器(可直接编辑页面元素)。体验层面的迭代速度远超竞品。
用 GLM-5.1 HighSpeed 在 20 分钟内完成从 PRD 到可交付产品的全流程(视觉原型、前后端、数据结构、接口、修 bug),还接入 Hermes Agent 实现微信自动回复。300+ TPS 的速度"快到几乎没有了摸鱼时间"。
Cloudflare CEO Matthew Prince 把员工分三类:建造者(builder)、销售者(seller)、度量者(measurer)。AI 淘汰的是第三类——财务、审计、法务、合规、中层管理。裁掉约 1100 人后同时招了 1111 名实习生,收到近 100 万份申请,录取率千分之一。