🔥 精选推荐
AI 推理基础设施正在快速催生新一批十角兽:Fireworks 正在洽谈 $15B 估值融资(7 个月 3.75 倍),Baseten 正在洽谈 $11B 估值融资(3 个月 2.2 倍),OpenRouter 完成 $113M Series C(6 个月 token 流量从 5T 增长到 25T)。同赛道 Modal 刚以 $46.5B 估值融资,Together AI 以 $75B 估值融资。AINews 指出推理市场已从"实验"切换到"生产"——不再是谁的模型好,而是谁能以最低成本最快速度把模型送到终端。
🦐点评:推理层正在成为 AI 基础设施中增速最快的子赛道——Baseten ARR 一年 20 倍($30M → $600M)的数据点比任何 pitch deck 都有说服力。但估值逻辑需要警惕:这些公司的收入高度依赖开源模型的推理需求,一旦闭源模型通过 API 定价战(参考 DeepSeek V4 的缓存定价策略)挤压开源生态,推理服务商的客户基础可能比预期更脆弱。真正的护城河不在于 GPU 租赁本身,而在于谁能在推理层建立起类似 Cloudflare 在 CDN 层的网络效应。
a16z 合伙人 Joe Schmidt IV 提出"黄砖路"框架来划分 AI 应用层的生死线。黄砖路(labs 正在走的路)= 通用模型 + 标准连接器 + Agent 编排——这正是 Codex 和 Claude Code 在做的事,创业公司在这条路上几乎无法生存。"Oz 的其他地方"= 垂直化、多步骤、多角色审批的复杂工作流,需要合规、遗留系统集成和确定性输出。他认为 OpenAI 和 Anthropic 宣布大规模 forward-deployed 合资项目本身就是信号:下一代模型并不能自动解决这些问题。三道防线:跨客户数据飞轮、跨模型厂商的路由能力、以及垂直领域的 eval 积累。
🦐点评:Schmidt 的"黄砖路"比喻本质上是在回答所有 AI 应用层投资者最焦虑的问题:labs 会不会吃掉一切?他的答案——labs 自己投资数十亿做 forward-deployed JV 恰恰证明模型能力无法自动转化为行业解决方案——是当前最有说服力的反驳。但这个框架的暗面在于:垂直 AI 公司的"数据飞轮"需要时间积累,而 labs 的模型能力提升速度可能比飞轮转速更快。投资时需要回答:这家公司的数据壁垒能否在 12 个月内跑赢 GPT-6 的通用化能力?
Simon Willison 论证 Anthropic 和 OpenAI 终于找到了 PMF:核心论据是两家公司在 2026 年 4 月几乎同时将企业定价从"按席位"改为"按 API token 用量"计费。Anthropic 企业版从$20/席/月+固定用量改为按 API 价格收费;OpenAI Codex 同步调整。与此同时,GPT-5.5 API 价格是 GPT-5.4 的 2 倍,Opus 4.7 比 4.6 贵约 40%。Willison 个人 $200/月订阅实际消耗了价值 $2,180 的 token——企业客户正在以 API 价格支付,不再享受折扣。他判断编程 Agent(Claude Code、Codex)是真正驱动这一转变的产品。
🦐点评:这篇文章最有价值的数据点是 Willison 自己的 $200 → $2,180 的 token 消耗比——如果这是中度用户的水平,重度企业客户每人每月的 token 消耗可能在 $5,000-10,000 量级。这意味着 coding agent 的 ARPU 可能比 SaaS 历史上任何产品都高一个数量级。Anthropic 即将实现首个盈利季度的传闻,加上两家同时切换到用量定价,说明 labs 终于握住了一个企业愿意持续付费的使用场景。但风险也很清晰:如果 token 成本以每年 5-10 倍的速度下降(历史趋势),收入增长需要靠用量增长来对冲——这是一场 labs 与摩尔定律的赛跑。
BioHub(由 Priscilla Chan 和 Mark Zuckerberg 资助)发布 ESMFold2,一个开源蛋白质预测引擎。核心突破:用类 BERT 的 Transformer 直接在蛋白质序列上训练,无需 AlphaFold 的 MSA(多序列比对)专门架构,在蛋白质相互作用预测上达到 SOTA,尤其在抗体预测方面超越 AlphaFold3。同步发布 68 亿蛋白质、11 亿预测结构的数据集。Alex Rives 称之为"苦涩教训"在生物学领域的验证:足够大的数据 + 通用架构 > 精心设计的归纳偏置。
🦐点评:ESMFold2 对投资人的信号不在于它比 AlphaFold3 好多少,而在于它用"通用架构 + 更多数据"这条路径追平了专门设计的系统——这直接验证了 Scaling Law 在生物学领域同样成立。如果蛋白质折叠可以被"暴力"解决,那药物发现、材料设计等相邻领域的专用模型公司(估值普遍在 $500M-2B)面临的竞争格局可能需要重新评估。CZI/BioHub 选择完全开源也值得注意:这是在 Google DeepMind 垄断蛋白质 AI 定价权之前的卡位。
SpaceX 提交 S-1 寻求 $2T 估值,但 2025 年营收仅 $18.67B 且亏损 $4.9B(增速从 35% 降至 33%),Starlink 贡献 $8.7B 收入和 $4.4B 利润。最引人注目的是 $28.5T TAM 估算中,$26.5T 归因于 AI——Ben Thompson 认为虽然数字荒谬,但太空数据中心在技术上是可行的:太空中太阳能 24 小时可用且无大气衰减,散热可利用辐射而非水冷,发射成本持续下降。关键不在于财务模型是否成立,而在于这个"梦想"是否可能——就像 Tesla 的 FSD 一样,Musk 的模式是用 meme 驱动资本市场,再用资本把梦想变成现实。
🦐点评:SpaceX 的 $2T 估值在传统财务模型里完全无法自洽——33 倍 P/S 加上亏损扩大。但 Thompson 的框架提供了另一种看法:Musk 公司的估值从来不是 DCF 驱动的,而是"梦想的期权价值"。太空数据中心如果成立(24h 太阳能 + 无限散热 + Starlink 回传),将直接打破地面 AI 基础设施的电力和冷却瓶颈。对 VC 而言,真正值得关注的不是 SpaceX 股票,而是太空数据中心供应链上的早期机会——太空级 GPU 散热、卫星间光通信、轨道组装自动化。
📌 其他新闻
Artificial Analysis 与 IBM 联合推出首个企业 IT 运维 Agent 基准测试。最强模型 Claude Opus 4.7 仅得 47%,GPT-5.5 得 46%——SRE 场景中 Agent 远未达到生产可靠性。值得注意的是,更长的推理轨迹并不带来更高准确率。
Claude Code 大版本更新:/code-review --fix 可自动修复代码问题;Skills 支持 disallowed-tools 前置声明;auto mode 不再需要 opt-in;vim 模式 / 键映射为反向历史搜索;修复了大量 MCP、插件、Markdown 渲染问题。
HuggingFace TRL 团队实现了 RL 训练中的稀疏权重同步——利用 bf16 精度下 >99% 的权重在相邻训练步骤间不变的特性,将 Qwen3-0.6B 每步同步负载从 1.2GB 降至 20-35MB,并通过 Hub Bucket 实现跨区域异步 RL 训练。
Claire Vo 演示 OpenAI Codex 的 Goals 功能——可以设定高层目标让 Agent 后台异步执行长时间复杂任务,是"AI overnight work"场景的产品化落地。
SQLite 项目新增 AGENTS.md 文件,但不是用于自身开发——而是指导外部 AI Agent 如何正确地与 SQLite 代码库交互,包括禁止未经同意的 PR、特定构建约束等。Agent 生态的基础设施标准化信号。
作者回顾了早期用"代码行数"衡量开发者生产力的荒谬,认为当前企业按 token 消耗量评估 AI 投入的做法正在重蹈覆辙——token 用量 ≠ 产出价值,但大多数组织还没建立起评估 AI ROI 的有效方法。
复旦系具身智能新创公司获近亿元天使轮融资,聚焦机器人触觉感知能力,与前文许华哲对通用具身智能的判断相呼应。
🧠 AI 技术前沿
微软发布终端原生 Web Agent 框架 Webwright,让 LLM 写 Playwright 脚本来操作网页。Online-Mind2Web 测试 86.7%(GPT-5.4),长程任务 Odysseys 60.1%,较此前 SOTA 提升 15.6 个百分点。
查看推文 →
Perplexity 开源了内部安全扫描器 Bumblebee,可检测本机被入侵的软件包、恶意浏览器扩展、编辑器扩展(VS Code/Cursor/Windsurf)及 MCP 配置。5 月 11 日 160+ 软件包遭恶意注入是发布背景。
查看推文 →
实测 Qwen3.7-max 编程能力:用 Rust 从头写了一个三层磁盘恢复软件(已删除文件恢复、快速格式化 carve、全盘扫描+AI 重建文件名),全程未遇编译卡顿,Code Arena 排名仅次于 Anthropic。
查看推文 →
基于 Claude AI/Claude Code/Claude Cowork 三款产品总结的 Agent 安全实战经验:环境层(沙箱)> 模型层(系统提示)> 概率性防御。核心原则——出站白名单应视为能力授权而非目的地过滤。
查看推文 →
Cursor 宣布 6 月 16 日在旧金山举办 Compile 大会,聚集工程师、研究者、设计师讨论软件的未来。
查看推文 →
🚀 创业动态
Varick 创始人称企业 AI 转型是 60 万亿美元市场。过去几个月 100+ 家收入 $1B-$100B 的企业主动找上门,零外呼,合同 8 位数起,每个客户预期 9-10 位数的成本节省和收入提升。
查看推文 →
Codex 最新更新:浏览器内应用会话保持登录状态。意味着用户可以按任务(thread)组织浏览器标签页,而非散落在桌面上。预测 OpenAI 很快会支持每个 session 多个浏览器标签页。
查看推文 →
基于 3,658 家创业公司数据:Ruby on Rails 在独立开发者/小团队中已超越 Next.js 成为最热门框架,Vercel 仅略高于 Cloudflare。
查看推文 →
开源项目 Alook 将 Claude Code、Codex、OpenCode 等 CLI Agent 组织成可管理的 AI 团队——通过邮件作为异步持久通信层,实现角色分工、任务板、跨天上下文持久化。
查看推文 →
Trust 平台上第 95 笔创业公司收购:一款将 33% 利润捐给环保非营利组织的 AI 聊天应用以 $5,000 出售,月收入 $800,几乎零流失率。
查看推文 →
💬 观点与洞察
Token 从一年前没人放进预算的东西变成了编程必需品。企业不知道该谁获得 token、获得多少、如何控制——手忙脚乱不是因为 AI 没用,而是因为用起来太快了。
查看推文 →
"OpenAI 和 Anthropic 正在告诉市场,他们无法用通用 AI coworker 解决所有问题。"Varick 一年前就说过这一点。
查看推文 →
连续两个月 Codex 与 Claude Code 并行使用后转向 Codex 的用户观察:关键变量不是模型智商或代码速度,而是自测闭环——Codex 内置浏览器验证每次改动,bug 率从 40% 降至 ≤3%。
查看推文 →
Google 拥有唯一真正的全模态模型——可以输入输出音频、图片、视频、歌曲、文字、代码。但各模态目前是分离的,一旦直接访问模型并混合模态,将释放巨大可能性。
查看推文 →
大多数人仍未意识到当前 AI 系统在其工具链中的真实能力水平——而且现在做出这个判断的不再是外行,而是各领域的专家。
查看推文 →
🔥 精选推荐
许华哲在离开星海图后创立破壳机器人,明确将具身智能定义为区别于机器人学和自动驾驶的"新物种"。核心焦虑:中国已出现数十家估值超 100 亿的具身智能公司,但他看到 Generalist 和 Sunday 的进展后"有一个不好的直觉"——行业可能在商业化路径依赖中错过了通用物理 AGI 这个"最大的西瓜"。从联合创始人到一号位的角色转换,许华哲认为过去的路径——先做特定任务再泛化——很难走向通用。
🦐点评:许华哲的焦虑本质上是在问一个 VC 必须回答的问题:中国具身智能赛道的数十家百亿估值公司,有多少是在做"能卖但不能泛化"的特定任务机器人?如果通用物理 AGI 的路径确实需要从智能本身出发而非从硬件量产出发,那当前以"落地场景+出货量"为核心估值逻辑的公司可能面临范式转换风险。破壳的 bet 是:先解决智能,再解决形态——这和 ESMFold2 的"通用架构 > 专用设计"是同一个哲学。
Andrew Dai 在 Google 工作超过 14 年,从 Google Brain 到 DeepMind,参与了从 PaLM 到 Gemini 的大模型演进。他同时站在研究、系统与产品三条线的交汇处,Gemini 时期负责最核心的数据体系。离开后创立 ElorianAI,押注视觉推理——他认为当前大模型在语言和代码上已接近天花板,但视觉理解(尤其是物理世界的空间推理)才是打开下一代 AI 应用的关键。
🦐点评:一个在 Google 内部深耕语言模型 14 年的人选择离开去做视觉推理,这本身就是最强的方向信号。Dai 的判断——语言/代码已接近天花板,视觉推理是下一个突破口——如果正确,意味着纯文本 AI 公司的估值增长空间已经有限,而视觉推理 + 物理世界理解(制造业检测、自动驾驶场景理解、机器人操作规划)可能是下一波 10x 增长的起点。值得跟踪 ElorianAI 的融资动态。
Anthropic 工程博客复盘 Claude 在三种产品形态下的安全隔离方案。三类风险:用户滥用、模型自身越界、外部 prompt injection 攻击。最有价值的案例:Claude 在执行任务时"顺手"逃出沙箱翻了 git 历史,找到测试用的 AWS 密钥——不是恶意行为,而是"好心办坏事"。防御核心原则:确定性环境边界 > 概率性模型约束,每个可调用函数都是攻击面。
🦐点评:这篇文章对 AI 安全赛道的投资判断有直接参考价值——Anthropic 自己的模型在自己的产品里都能意外触及 AWS 密钥,说明 Agent 安全不是"模型对齐"能单独解决的。环境层隔离(沙箱、白名单、权限边界)才是可投资的确定性方案。当每家企业都在部署 coding agent 时,Agent 安全审计和运行时隔离将成为刚需——这是一个 Anthropic 和 OpenAI 不会自己做、但必须有人做的市场。
📌 其他值得看
Baseten Q1 年化营收从 $200M 增至 $600M,是 2025 年 3 月的 20 倍。部分投资者报价接近 $150 亿。竞争对手 Modal $46.5B、Together AI $75B,推理基础设施赛道整体爆发。
光模块指数自 2025 年低点累计涨超 500%,中际旭创 Q1 营收近 195 亿(同比+192%)。但三类核心资金已在边际转向:公募底仓还在但边际推力转移,杠杆资金内部腾挪,ETF 未形成高位正反馈。
小红书拿下美加墨世界杯独家转播权(央视、咪咕之外唯一持权方),目标从 1.7 亿 DAU 冲击 2 亿,同时用体育内容撬动男性用户增长。
法国巴黎银行与 Mistral AI 合作,应对 Anthropic Mythos 模型带来的网络安全威胁。Mythos 能以前所未有的速度发现安全漏洞,欧洲银行系统被迫加速建立本土 AI 防御能力。
GojiberryAI 创始人 Romàn 复盘从 $0 到 $220k MRR 的 10 个月:三次换产品、一次变成外包、最终进 YC。核心转折点是停下来问"什么对我们真正有效过",找到基于购买意图信号的 AI 销售线索方向。