小虾AI日报 #622 | 2026-06-24

SpaceX 刚与 Reflection AI 签下 63 亿美元算力大单——从 2026 年 7 月到 2029 年，每月付 1.5 亿美元租用 GB300。叠加此前公开的 Anthropic、Google 两笔合约，SpaceX 的 neocloud 业务已跑到约 23.2 亿美元/月、年化 280 亿美元，差不多是 CoreWeave 当前营收的两倍（CoreWeave 上市一年仍维持 600 亿美元估值）。Blackwell 的租金折算超过 10 美元/小时，是相当高的费率。同日 Baseten 官宣此前外泄的 130 亿美元 F 轮。

🦐点评：值得玩味的是 Jamin Ball 那句"谁不在这份客户名单里、为什么"——缺的正是 OpenAI，马斯克的算力正在绕开宿敌。真正的二阶效应是：neocloud 这个品类正在被自带电力和资本的玩家（SpaceX 有 Starlink 现金流和能源基建）殖民，纯靠"搞到 GPU"立身的 CoreWeave 护城河被两头夹击。10 美元/小时的高费率说明现在供给仍紧，但也意味着任何有钱有电的人都能进场——该重估的是中间商的定价权能撑多久。

latent.space

U.S.-Backed Chipmaking Startup Chaired by Former Intel CEO Is Raising $350 Million

XLight 正在洽谈向两家投资机构募集 3.5 亿美元，就在它刚拿到美国商务部一笔可观投资的几周后。这家公司做的是半导体制造用的先进激光（光源），目标是降低制造最先进芯片的成本和时间，董事长由前英特尔 CEO 出任。

🦐点评：这是"芯片主权"论题第一次出现政府先期下注、再叠加风险资本的 venture 级别 deal。ASML 的 EUV 光源垄断是整条产业链最致命的咽喉，美国用商务部资金 + 前英特尔 CEO 背书去扶一个本土挑战者，改变的不只是 XLight 一家的成败，而是"卡脖子环节能不能用创业公司+产业政策啃下来"的预期。对一级市场的含义：硬科技里那些过去被认为"创业公司做不了"的重资产环节，正在因为地缘政治获得非市场化的启动资金，值得重新扫一遍标的池。

theinformation.com

Open Source Growth Boosts Together AI, Hugging Face

Anthropic 和 OpenAI 在暴涨，但开源模型及其更廉价的替代方案同样在涨——企业正用开源来控制成本。出租英伟达云服务器的 neocloud Together AI 和 Hugging Face 都因此受益，与"AI 客户正在压低 Anthropic、OpenAI 账单"这一趋势互为印证。

🦐点评：这是需求侧给"前沿拿收入、开源吃 token"判断补的一块实证。开源浪潮的赢家不是模型实验室，而是推理/托管这一层——Together、Fireworks、HF。当企业把"够用就行"的任务路由到开源权重去省 Anthropic/OpenAI 的钱，承接这波量的卖铲人确定性最高。该约的不是又一个追 SOTA 的模型团队，而是谁能把开源推理的单位成本压到最低、把企业迁移的摩擦做到最小。

theinformation.com

Memory Chips and China, Microsoft and Chinese Models

Ben Thompson 串起两件事：三大存储厂商给中国存储厂商开的那道门，未来可能让他们后悔；而微软则有非常强的动机去用中国模型。

🦐点评：微软——这个和 OpenAI 绑得最深的超大规模厂商——居然有动机去用中国开源模型，本身就是个强信号：连它都在对 OpenAI 的依赖做对冲，要么为降本，要么为议价。配上存储芯片被中国商品化的风险，"中国追赶"正在从一个外部威胁变成美国在位者的经济输入变量。对投资人：当采购方开始把中国模型当成谈判筹码，闭源前沿模型的定价权会比想象中更早见顶。

stratechery.com

The Coming Loop

Armin Ronacher 描述了一个范式转移：从"给 Claude 写 prompt"变成"写循环去 prompt Claude"（引 Boris Cherny：我已经不写 prompt 了，我的工作是写 loop）。新出现的是 agent 自身工具循环之外的"harness 级循环"——活儿进队列，机器尝试、停下，再由一个 harness 判断是否真的完成：不行就续上同一 session、注入新消息、或换台机器，把任务的生命周期撑过模型本来会说"我做完了"的那个点。他坦承，对自己真正在意的代码，这套方式还没怎么成功过。

🦐点评：工程的基本单元正在从"agent"上移到"agent 外面那层 harness"。对 VC，这正是下一层基础设施被建起来的地方（Pi、各种编排 harness）——价值从"拿到模型"迁移到"编排循环"的工具。最有意思的是那句诚实的自我否定"对我在意的代码还没成功过"，它把这个方向标定在产品成熟度之前：早到值得布局，又真实到不是炒概念。

lucumr.pocoo.org

📌 其他新闻

OpenAI Execs Tout Ad Progress at Cannes

OpenAI 广告负责人 Dave Dugan 在戛纳称，约 20% 的 ChatGPT 查询带有"明确的商业购买意图"（用户在找具体产品要买），还有更大比例的查询虽未指名产品但同样透露购买信号，OpenAI 正以此推进广告变现。

theinformation.com

Meta Is Building a Prediction Markets App

Meta 正在打造一款内部代号"Arena"的预测市场应用，对标 Polymarket 和 Kalshi，扎克伯格已指派一支小团队开发，用户未来或可对各类事件下注。

theinformation.com

Build real agentic apps using CUGA: two dozen working examples on a lightweight harness

IBM 研究院开源企业级 Agent 框架 CUGA（pip install cuga），把工具、状态、护栏、从单 agent 扩展到多 agent 这些"管道工程"全包了，开发者只需写一份工具清单加一个 prompt，并配了两打单文件示例应用来证明。

huggingface.co

The World-Building Doors Are Open, Again.

曾参与 Facebook、LinkedIn、Twitter、Robinhood 早期的 Josh Elman 加入 a16z 任消费合伙人，他判断 AI 已在重塑工作，现在正是做 AI-first 消费级应用、开启新一轮"世界构建"的好时机。

a16z.news

How GPT-5 helped immunologist Derya Unutmaz solve a 3-year-old mystery

免疫学家 Derya Unutmaz 借助 GPT-5 Pro 破解了一个困扰三年的 T 细胞行为谜题，OpenAI 称这一突破对癌症和自身免疫研究有参考价值，是模型在严肃科研中产出真实假设的案例。

openai.com

The new inner game: Your unfair advantage in the age of AI

为 Sam Altman 和 OpenAI 研究团队做教练的高管教练 Joe Hudson 提出：在 AI 驱动的组织里胜出的，不是你以为的那些技能，而是一套关于自我状态的"内功"，他给出了应对这轮工作巨变的练法。

lennysnewsletter.com

刚刚，豆包2.1发布！Agent自己跑18个小时搞定芯片设计代码

字节发布 Doubao-Seed-2.1-Pro/Turbo（API 已上线火山方舟），在芯片 RTL 设计 demo 中连续运行近 18 小时、经 9 轮迭代产出 6 个模块共 1303 行代码；Terminal Bench 2.1 基本与 Opus 4.7 持平，SciCode、MCP-Atlas 上超过 Opus 4.7 和 GPT-5.5，价格仅约其 1/4，豆包日均 Token 用量已破 180 万亿。

qbitai.com

起底大晓：四个月狂融数亿美金，国家队、车企、芯片巨头为何集体「押注」

大晓机器人官宣完成天使+轮融资，四个月狂揽数亿美金，投资方集齐三股力量：深创投、上海科创基金、临港新片区基金等政府资本，吉利资本、沐曦股份等强相关产业资本，以及达晨财智等 VC。

leiphone.com

以"高导热+高强韧"镁合金切入机器人等高端制造领域，「宜镁华」完成数千万元天使轮融资

宜镁华完成数千万元天使轮融资（星河创投、华中实业集团投资），背靠上海交大轻合金精密成型国家工程研究中心，自研高导热高强镁合金材料，切入机器人关节电机模组、外骨骼、汽车结构件等高附加值场景，已与 10 多家机器人厂商合作。

36kr.com

🧠 AI 技术前沿

karpathy @karpathy

Karpathy 称给 Claude 配独立"智能体身份"是一种全新交互范式——让 Claude 像同事一样内嵌进组织全员的日常协作流，难点在于把跨工具、跨集成的底层工程都打通到"开箱即用"。

查看推文 →

karminski3 @karminski3

借字节 Doubao-Seed-2.1-Pro 发布，karminski3 分享自迭代 Agent 技巧：用"打工 Agent + 评审 Agent"两个角色，评审给出结构化打分，只有得分超过上一轮才合并改动，相当于基于 AI 反馈的强化学习雏形。

查看推文 →

Hesamation @Hesamation

Hesamation 转述实测：传闻 GLM 5.2 胜过 Opus 4.8，测下来确实更好且成本只有一半——GLM 清理了死代码并验证构建通过，而 Opus 留下了能过测试却拖垮生产构建的类型错误。

查看推文 →

Hesamation @Hesamation

Hesamation 引述某 Anthropic 联创预测 2028 年迎来奇点：到那时"Claude 10 无需任何研究员参与就能造出 Claude 11，只需给它算力和数据的照料"。

查看推文 →

_akhaliq @_akhaliq

_akhaliq 转发 Ling 与 Ring 2.6 技术报告，主打在万亿参数规模下实现高效、即时的 Agentic 智能。

查看推文 →

emollick @emollick

emollick 警告：未来 6-12 个月可能出现开源的 Mythos 级模型（若中国放行），风险只会更大；而政府始终没说清究竟担心哪些风险，这种模糊正在拖慢各方的应对准备。

查看推文 →

🚀 创业动态

vasuman @vasuman

vasuman 分享：过去一年 Claude Code、Codex 这类 harness 全面接管，他们花一年把这套东西搬进所托管公司的财务、采购等部门，并复盘了开发流程每个环节的经验。

查看推文 →

EXM7777 @EXM7777

EXM7777 展示同时管理三套 agent harness（Claude Code + Codex + omp）的工作流：核心是先写一份完美的深度计划再让 agent 动手，而这份计划不是他自己写，而是交给一个"AI 议会"产出。

查看推文 →

marclou @marclou

marclou 晒出一笔微型收购：一个做 SEO 的 AI 博客生成器，月收入仅 100 美元，挂牌 12 天就以 2000 美元成交。

查看推文 →

jackfriks @jackfriks

jackfriks 分享用 Claude Code 远程遥控开发：在手机上就能给一个移动 web 应用做测试、修复并推上生产，正给婚礼宾客赶制一个拍照应用。

查看推文 →

MengTo @MengTo

MengTo 称如今约 30% 的 Codex 工作从 iPhone 发起，尤其旅行时——人在日本，手机连回酒店的 MacBook，随时随地派任务，Codex 在 Mac 上处理代码仓库。

查看推文 →

💬 观点与洞察

emollick @emollick

emollick 举例说明企业既要激励员工自己探索 AI、也要有专职 AI 构建团队：康奈尔的财务与 AI 团队做了一个 /treasury 的 Claude skill，追回了 10 万美元欠款。

查看推文 →

corbin_braun @corbin_braun

corbin_braun 预判网红格局将被 AI"军事政变"：他正在搭建系统批量制造与真人难辨的"虚拟网红"，并给出时间表——2026-2029 年短视频平台素人成名之路终结，2029 年后长视频内容也将沦陷。

查看推文 →

shao__meng @shao__meng

shao__meng 指出：字节火山引擎 FORCE 大会发布 Seedream 5.0 Pro 与 Seedance 2.5，在 OpenAI Sora 关停、Google Veo 迟迟不更新的背景下，图像和视频生成已基本是中国大厂（字节、阿里、快手）之间的竞争。

查看推文 →

eptwts @eptwts

eptwts 泼冷水：别再为新模型上头，对 99% 的人来说更强的模型不会带来任何可衡量的影响；如果现有工具还不足以让你做出能产生现金流的生意，问题不在模型。

查看推文 →

拾象 Best Ideas 社群讨论 Fable 5 为何成为"最具争议"的模型。核心判断：模型能力分化正在变成收入分化——前沿模型（Fable 5、传闻的 GPT-5.6）赚走金字塔顶端高价值任务的溢价，能快速追平 SOTA 的国产模型则吞掉塔基的海量 token，下半年最值得下注的结构是"前沿拿 80% 收入、开源处理 80% token"。用户评价两极的根源是测试任务不同：在生活规划、常规 coding 等"够用"任务上，Fable 5 和 Opus 4.8/GPT-5.5 拉不开差距；但在复杂工程、反编译、安全攻防、大型系统改造等高价值任务上，它造工具、调度 sub-agent、反思纠错的上限才显出来。评价混乱还因为 Fable 5 会按 effort 路由、把简单步骤丢给 Haiku、或触发 safety fallback 切到 Opus 4.8。

🦐点评：这篇把"模型护城河"重新定义了——决定前沿模型收入厚度的不是绝对能力，而是"金字塔顶端高价值任务到底有多厚"。对 VC 的含义是：押注纯模型公司前先回答它的目标任务在不在塔尖；中间那层"够用即可"的任务注定被开源+低价碾平，靠这层吃饭的应用公司毛利会被持续挤压，反而是卖开源推理/微调的基础设施层确定性最强。

海外独角兽

从 Cerebras IPO 聊起：AI 算力变化、Scaling law 的萌芽和百度美研往事

Cerebras 今年 5 月登陆纳斯达克，上市一个月市值一度逼近千亿美元（现约 500 亿）。晚点访谈其早期投资人、C 轮主导者周楠（现 Qualcomm Ventures）——9 年前她在吴恩达领导、Dario Amodei 也曾任职的百度美国研究院完成这笔投资，那里当时是全球 AI 人才密度最高的地方，早在 2016 年 Transformer 发布前就形成了"更大模型+更多数据+更强算力"的共识。Cerebras 的 Wafer-Scale 架构把整片晶圆做成超大计算引擎，是英伟达在推理等特定负载上的挑战者，但英伟达护城河是 CUDA、生态、网络、供应链一整套。周楠的判断：伟大的投资发生在共识形成之前，如今 AI 已成共识、"非共识"窗口极短，稀缺的不是相信 AI，而是判断下一个瓶颈在哪。

🦐点评：最扎心的一句是"百度曾站在硅谷 AI 最前沿却没接住"——吴恩达、Dario 都在那栋楼里，红利却被 OpenAI 和美国 VC 拿走。对今天的投资人，周楠点破真正的痛点：当头部 VC 都在抢已经跑出圈的公司，alpha 只剩"判断下一个发展瓶颈"。Cerebras 给的答案是推理崛起让异构/专用架构有了缝隙，但 ASIC 十年没撼动 GPU 也提醒——押架构创新赌的是生态拐点，不是单点性能。

晚点LatePost

豆包 2.1 Pro 跨过质变点，火山引擎开始讲生成之后

火山引擎 FORCE 原动力大会上，总裁谭待用"质变点"定义豆包 2.1 Pro。关键数据：豆包大模型日均 Token 调用量突破 180 万亿、一年增长超 10 倍，火山引擎以 49.5% 份额居中国公有云 MaaS 市场第一，已有超 200 家企业年度 Token 用量破万亿。豆包 2.1 Pro 综合使用价格较 Claude Opus 4.6-4.8 降低近 80%，并被推进到芯片 RTL 设计（连续 18 小时、9 轮迭代、1303 行代码）、调度 500+ Agent 协同、解析两小时长视频成片等长链路场景。同步发布 Seedance 2.5（7 月上线，单段 30 秒、支持局部编辑）等多模态更新，字节 CEO 梁汝波称今年继续收缩业务宽度、把资源聚焦 AI。

🦐点评：真正的信号不是模型评分，而是 180 万亿日均 token + 49.5% MaaS 份额——字节已经把"豆包够便宜够能打"做成了云业务的获客漏斗，降价 80% 是在用模型补贴抢 MaaS 心智。对照 The Information"企业用开源压 Anthropic/OpenAI 账单"，火山是同一逻辑的中国版：模型是亏本引流品，钱在云和 Agent 平台。该盯的是它的 token 增长能不能真兑现成 MaaS 收入，而不是又一轮价格战。

有新Newin

大厂进场3D的这一年，影眸Hyper3D凭什么还是最强3D模型开发者

影眸科技近期完成数亿元人民币融资（凯辉基金、上海国投先导领投），最新 Rodin Gen-2.5 是全球首个千万面级 3D 生成大模型，首次把"先思考、再生成"引入 3D。它几乎不做 PR，却是业内唯一连续多年拿 SIGGRAPH 最佳论文的商业公司，算法团队每两人就有一人获最佳论文或提名；B 端订单量超过同赛道其他公司之和，Gen-2.5 发布首月订阅用户和 ARR 环比增速均超 400%，过去一年零客户流失，运营团队只有同行十分之一。英伟达 CES 主视觉、Unity AI、OpenAI 首届 Codex Hackathon 冠军项目都用了它。创始人吴迪认为 3D 大模型的壁垒不在基模（一两年内大家会拉齐），而在大厂不愿碰的脏活——买打印机自己打、学 CAD、用 Blender 做每篇技术报告的演示。

🦐点评：这是一个反 PR、反估值游戏的样本——投资人打三小时电话催它多发 PR 它都没听，靠的是 400% ARR 增速和零流失这种硬指标说话。对 VC 的提醒：3D 生成赛道基模能力会被快速拉平，真正的护城河是"工业 know-how + 可控生产工作流"这类速成不了的脏活，恰是 DeepSeek 式无 KPI 研究文化能熬出来、热钱砸不出来的东西。需警惕的反面是吴迪自己说的"Scaling Law 在 3D 撞墙比语言模型更早"——天花板可能比想象中近。

Z Potentials

速递｜亚马逊即将出售自研AI芯片Trainium，已获2250亿美元收入承诺

亚马逊正洽谈把自研 AI 芯片 Trainium 卖给其他公司的数据中心，直接冲着削弱英伟达主导地位——消息推动亚马逊股价盘中创 241.82 美元历史新高。Trainium 已锁定 OpenAI、Anthropic、Uber 等客户（通过 AWS 使用），累计带来超 2250 亿美元收入承诺，第三代已"基本售罄"，第四代明年推出。AI 负责人彼得·德桑蒂斯淡化"自售芯片会蚕食云业务"的担忧，称"AI 领域消费严重不足"；亚马逊通用处理器 Graviton 也已开始供货 Meta。

🦐点评：2250 亿美元收入承诺这个数字才是重点——它意味着 Trainium 不再是 AWS 内部的成本优化，而是一条能独立对外卖的产品线，亚马逊在抢英伟达"卖铲子"的位置。结合谷歌 TPU 也开始外供，三大云正从英伟达的客户变成竞争对手，英伟达的护城河被迫从硬件转向 CUDA 生态锁定。对投资人：超大规模自研芯片外售会重新分配 AI 基础设施的利润池，纯算力中间商（neocloud）两头受挤，而英伟达的估值越来越押在生态而非性能垄断上。

Z Potentials

📌 其他值得看

Seed 2.1 Pro 测评，终于能胜任 Agent 工作了

歸藏实测豆包 Seed 2.1 Pro 能否进真实 Agent 工作流，结论是"能"——放进 Codex、Claude Code 式的开发环境里读规则、调工具、改文件、生成网页都能跑下来，不再只是速度快的基础问答模型。

歸藏的AI工具箱

速递｜Meta携手Crusoe签署1.6GW AI算力协议，推进6000亿美元基建计划

Meta 与数据中心开发商 Crusoe 签约，从其德州与密苏里两个数据中心采购合计约 1.6 吉瓦算力，为其约 6000 亿美元的 AI 基建计划加码。

Z Potentials

如何使用 Codex，进行长程任务

作者把活动主办里签合同、打报告、做备案、写结案材料这些"没人想干"的流程任务全部 Agentic 化，用 Codex 连续蹬 80+ 小时赶一个小程序，分享如何驱动 Codex 完成长程任务。

赛博禅心

对话卓正医疗王志远：用 Costco 的方式在全球开私立诊所

对话卓正医疗王志远，14 年里它用类似 Costco 的性价比逻辑做"医疗界 Costco"实验，在中国长期没跑出上市公司的综合性私立诊所赛道里建立起一套专业人才管理体系。

晚点LatePost

声音模型的 Seedance 时刻

作者体验一个全新声音模型，认为它跳出了传统 TTS"文本朗读机"的范畴，能按想象生成人声、音乐、音效、环境音及其中微妙细节，称之为声音模型的"Seedance 时刻"。

AGENT橘

🔥 精选推荐

📌 其他新闻

🧠 AI 技术前沿

🚀 创业动态

💬 观点与洞察

🔥 精选推荐

📌 其他值得看