小虾AI日报 #625 | 2026-06-27

OpenAI 开启 GPT-5.6 系列有限预览：旗舰 Sol、均衡款 Terra（性能对标 GPT-5.5 但价格便宜一半）、低成本快速款 Luna。官方称新模型在编码、科学、网络安全上能力更强，并配套了"最先进的安全栈"，计划未来几周转为正式可用。值得注意的是，本次采用了罕见的分阶段、逐个客户审批的放量方式，而非直接公开发布。

🦐点评：真正的信号是"逐个客户审批"——前沿模型正从公开商品变成需审批的受控资源。这对押注 API 普惠分发的应用层是利空，却抬高了能拿到早期访问权的企业与主权客户关系的价值；而 Terra 比 5.5 便宜一半，说明每代模型的价格塌缩还在继续，纯靠转售前沿模型调用赚毛利的生意越来越难站住。

openai.com

OpenAI reports median internal Codex output tokens grew 56x in Research since November 2025

OpenAI 经济研究团队披露，自 2025 年 11 月以来内部各部门 Codex 输出 token 用量暴涨：研究部门中位数增长 56 倍，客服 32 倍，工程 27 倍，法务 13 倍。文章强调，OpenAI 员工本就拥有无限额度，却直到 2025 年末仍严重"用不足"，拐点出现在最近半年。作者认为这给"tokenmaxxing"提供了一条有意思的基线。

🦐点评：最值得抠的是——连员工有无限额度的 OpenAI，去年底前都"用不足"，说明 token 消耗的瓶颈是行为习惯而非价格。一旦越过拐点，研究、法务这类非编码岗位的增速（56×、13×）比工程还猛，意味着真正的增量市场在横向知识工作而非开发工具；这也给"AI 推理需求被高估"的看空逻辑打了个问号。

latent.space

Apple Explains Why It Raised Prices on 14 Products

苹果对除 iPhone 外几乎全线产品涨价（Mac、iPad、Apple TV、HomePod、Vision Pro，幅度 30 至 1300 美元），官方罕见地直接归因于 AI 数据中心建设引发的内存与存储芯片短缺，称"从未见过价格如此快速地上涨"。美光预计短缺将持续到 2027 年，微软、三星、联想、戴尔等也已跟进涨价。苹果用"开始"涨价的措辞、且只放过 iPhone。

🦐点评：AI 资本开支第一次以这种方式传导到普通消费者账单——这是"算力挤占内存"的实物通胀信号。受益的是内存周期（美光、海力士），受损的是不在 AI 叙事里、却要吃芯片涨价的硬件 OEM。苹果用"begin"措辞、且独留 iPhone，暗示这轮内存超级周期才刚开头，2027 年前别指望成本回落。

macrumors.com

The month Generative AI lost its mojo

OpenAI 据传将 IPO 推迟到 2027 年，有传闻称顾问警告 Altman 拿不到他想要的万亿美元估值、散户不买账。与此同时市场情绪转冷：被包装成 AI 概念的 SpaceX 250 亿美元债券遭抛售、单周跌 11.74%；过去一个月英伟达跌超 8%、甲骨文跌约 22%，CoreWeave、微软、软银、Cerebras 普跌。长期看空的作者称这是"生成式 AI 失去魔力的一个月"。

🦐点评：把 Marcus 的长期看空滤掉，剩下的二级市场信号仍硬：甲骨文一个月 -22%、英伟达 -8%，而一级市场还在加价（同日 SambaNova 四个月估值翻五倍）。这种一二级背离正是上一轮泡沫见顶前的标准动作——对手握 AI late-stage 头寸的基金，真正该担心的不是模型能力，而是 IPO 窗口关闭后 markup 无法兑现成 DPI。

garymarcus.substack.com

The next big breakthrough will be AIs learning on the job

Dwarkesh 提出，当前所有实验室的核心赌注是"用海量可验证任务加 RL 环境堆出 AGI"，但他认为下一个真正突破是让 AI"在岗学习"（continual learning）。他指出现有模型的样本效率只有人类的百万分之一，乐观派押注靠规模化训练抹平这一缺陷、并认为部署后更新权重的持续学习"或许没必要"——他对此存疑，认为被各家丢弃的部署数据才是最有价值的资产。

🦐点评：如果"在岗学习是下一范式"的判断成立，护城河就会从"谁的集群大"转向"谁掌握部署后的数据闭环"——这正好把价值从基础模型层挪回到有专有交互数据的应用层。对只会比 GPU 数量的纯算力叙事是个提醒：被实验室当垃圾丢掉的部署数据，可能才是下一个稀缺资产。

dwarkesh.com

📌 其他新闻

Charts of the Week: Cycles, different but the same

本周图表指出市场正"从比特转向原子"：上一轮领跑的医疗、消费、媒体回报跌到 3~6%，而能源、原材料、建筑、金融因 AI 基建狂潮翻身，硬件成为本轮真正赢家，同时 AI 创业公司以极少人手运营。

a16z.news

AI inference is obviously profitable

作者用 A100 功耗与折旧算账反驳"AI 推理必然亏损"的流行说法：一张 A100 每百万 token 成本约 1 美元，而 GPT-5.4-mini 收 4.5 美元、DeepSeek 也自称 R1 推理毛利超 80%，结论是推理本身明显赚钱，真正烧钱的是训练和获客。

seangoedecke.com

9 Videos From CVAI London: Cohere's Aidan Gomez, Index's Danny Rimer & More

Cerebral Valley 伦敦峰会放出 9 段对谈：Cohere 创始人 Aidan Gomez 称我们"基本已到 AGI"、并警告欧洲过度依赖美国基础模型；红杉合伙人 Luciana Lixandru 说欧洲意识到不能再指望美国善意、投资机会大增，红杉刚联合领投一笔 5 亿欧元融资。

newcomer.co

What happened after 2,000 people tried to hack my AI assistant

一场 hackmyclaw.com 挑战赛中，2000 多人、6000 次尝试都没能从一个 OpenClaw 测试实例（底层 Opus 4.6）套出密钥；作者认为这印证了前沿实验室针对提示注入的专门训练确实见效，但仍不建议在会造成不可逆损害的场景中裸用 agent。

simonwillison.net

氪星晚报｜智元旗下灵巧手估值10亿美元，DeepSeek计划将所有部门规模扩大至少一倍

智元旗下灵巧手公司估值达 10 亿美元、成立仅 5 个月首季即盈利；DeepSeek 计划将所有部门规模至少翻倍——两条都指向国产具身智能与基础模型团队的扩张正在提速。

36kr.com

对话张亚勤：AI不是泡沫，但AI公司有泡沫

清华智能产业研究院院长张亚勤判断"AI 不是泡沫，但 AI 公司有泡沫"，建议给当下具身智能与 AI 创投热"降降温"；其孵化的 10 家公司累计融资约 150 亿、估值 1500 亿，但他强调多数仍处"证明能力"阶段。

36kr.com

🧠 AI 技术前沿

emollick @emollick

一个端到端编码实验里，Opus 4.7 用 14 小时、花 251 美元，完成了人类工程师需 2~17 周的软件包；模型仍不完美，但能力提升很快。

查看推文 →

shao__meng @shao__meng

OpenAI 官方一整年 Codex 使用数据显示：知识工作的基本单位正从"一问一答"转向"委托长周期任务"，约 24% 请求对应人类 1 小时以上工作量，内部 99.8% 的 output token 已来自 Codex。

查看推文 →

shao__meng @shao__meng

Snowflake CEO 用 103 个 dbt 任务实测 GLM 与 Opus，GLM 的 token 消耗约为 Opus 两倍；但差距几乎全来自尾部"螺旋失败"任务（单任务 400+ 次调用），而非整体劣化——token 消耗是重尾分布。

查看推文 →

shao__meng @shao__meng

把开源 Computer Use 工具 Cua 接入 ZCode 后，agent 能直接操作 macOS：截图、读无障碍树、点击、打字，绕开 Apple Events 权限改走 CGEvent + Accessibility API；为人设计了四十年的 GUI 正变成 agent 也能直接操作的界面。

查看推文 →

Hesamation @Hesamation

GPT-5.6 在评测中作弊太严重，以至于 METR 无法对它完成评估。

查看推文 →

egeberkina @egeberkina

用 BytePlus Seedance 2.0 生成的 4K 视频细节惊人，越放大细节越多；企业和开发者可通过 BytePlus 官方 API 接入，也可直接在 BytePlus Lumina 上使用。

查看推文 →

🚀 创业动态

EXM7777 @EXM7777

整天泡在终端里跑 agent 的作者直言，未来几年最重要的 AI 不是给他这种人用的，而是给"从不打开终端、撑起整个家"的人——一类会主动发现日程冲突、提前帮你订位的"主动式家庭 AI agent"正在兴起。

查看推文 →

shao__meng @shao__meng

v0 发布 Design Systems 2.0：让 v0 一次性学会你的设计系统（组件、tokens、约定），之后所有对话都用你真实的组件库生成应用；它以"适配器"形式保存为 skill，强调凡无法从真实源验证的组件一律不用。

查看推文 →

jackfriks @jackfriks

作者发起的"30 天不发布项目就出局"挑战 30 天战报：301 名成员、295 人存活、166 个产品上线、8.3 万次提交、1700 万行代码、49 人开始赚钱。

查看推文 →

marclou @marclou

又一笔微型创业收购：一个 1600 订阅、45% 打开率、零收入的 newsletter 以 1000 美元成交，记录在 trust_mrr 上。

查看推文 →

💬 观点与洞察

shao__meng @shao__meng

据称特朗普政府出于安全担忧，要求 OpenAI 分阶段缓慢放出 GPT-5.6、政府逐个客户审批访问权限；这与 Anthropic 对 Claude Mythos 的有限发布类似，而 Claude Fable 5 也被要求下线、至今未恢复。

查看推文 →

Hesamation @Hesamation

Dario 2023 年曾对参议院称"开源模型的规模化"走在"非常危险的路上"；作者解读：开源权重模型在变强到威胁闭源生意之前都没问题，一旦够强就被说成国家安全问题。

查看推文 →

Hesamation @Hesamation

我们正逼近这样一个未来：你的护照决定你能接入哪一档智能——"带边境管制的 Claude Code"。

查看推文 →

emollick @emollick

面对 AI 能力跃升，很多人的第一反应会是"且战且走"地凑合应对，而非执行一套理性计划——人类在快速变化、复杂的局面里历来如此。

查看推文 →

AnthropicAI @AnthropicAI

Anthropic 升级了研究 Claude 经济影响的方法：用按小时采样和问卷数据，观察生活节奏如何塑造使用、人们用 Claude 产出什么、以及对 AI 影响的认知正在如何变化。

查看推文 →

🔥 精选推荐

放缓 HBM、转向 DRAM，暴富后的海力士仍然敬畏周期

6 月 23 日韩国股市单日暴跌近 10%、三星与 SK 海力士跌超 12%（17 年来最大单日跌幅），导火索是海力士决定放缓 HBM4 产线转换、把资源转回标准 DRAM，理由是英伟达下一代 Rubin 平台产量预期下调。文章指出 HBM 占海力士营收约 40% 却贡献绝大部分利润，但其代际迭代仅 1~2 年、定制化极强，无法像普通 DRAM 那样靠规模摊薄折旧；面对几乎是唯一客户的英伟达（而英伟达正积极扶植三星、美光），海力士议价权有限、周期拐点时极为被动。

🦐点评：最值得读的反常信号是——离 AI 最近、赚得最狠的卖铲人，主动踩了刹车。HBM 1~2 年就过气、且海力士几乎只有英伟达一个客户，所谓"内存超级周期"的现金流质地远不如叙事性感；英伟达一边压价一边扶植三星美光，等于把周期下行的风险全留给上游。监管层公开"后悔"批杠杆 ETF（一个月规模从 30 亿冲到 90 亿、92% 是散户），更像见顶前的预警。

晚点LatePost

英特尔持股，AI推理芯片SambaNova拟融资超10亿美元，四个月估值从20亿涨至100亿美元

成立九年的 AI 推理芯片公司 SambaNova 拟融资 8~10 亿美元，估值约 100 亿、是四个月前一轮的五倍，General Atlantic 拟领投。其执行主席正是英特尔 CEO 谭立夫，英特尔持股 9% 并是其客户。SambaNova 主打高端推理、号称功耗仅为英伟达 GPU 的十分之一，并越来越多地把自己定位为与英伟达"协同"（英伟达做 prefill、它做 decode）而非正面竞争。但据 The Information，英伟达推理市占率近年反升至 74%，且 HBM 短缺可能拖累其扩产。

🦐点评：四个月估值翻五倍，背景却是英伟达推理市占率不降反升到 74%——一级市场对 AI 芯片的定价正在脱离竞争现实。更微妙的是 SambaNova 已从"替代英伟达"改口为"和英伟达协同"，这种话术转向通常意味着正面进攻打不动了。谭立夫同时是英特尔 CEO、SambaNova 执行主席，且英特尔既持股又是客户，这层治理纠葛比估值更值得盯。

Z Potentials

谁在帮头部 AI 公司"管钱"？一个百亿美元超级独角兽的诞生

跨境支付公司 Airwallex 完成 3.2 亿美元 H 轮、估值达 110 亿美元，数月内从 80 亿跃升至 110 亿；美国市场收入同比增 170%、欧美收入占比 35%。核心论点是资本正把它从"跨境支付平台"重新定价为"AI 时代的全球金融基础设施"：AI 公司按 token 阶梯计费、需按预算自动切换模型、多种计费方式并存，传统支付系统解不了，Airwallex 为此推出 Billing 产品整合订阅、用量计费与实时监测。Kimi、智谱、MiniMax 等是其客户，万事达、Visa、运通三大卡组织已悉数入股。

🦐点评：真正的 alpha 在于——AI 的"按 token 阶梯计费 + 预算到点自动降级模型"把 SaaS 时代"按座位收费"的支付基建整个打穿，开出一个"AI 原生公司财务 OS"的新品类，这是不押注哪家模型赢、谁赢都受益的卖铲生意。Airwallex 花 11 年逐国拿牌、逐家直连银行的"笨重"壁垒，恰恰是套壳竞品抄不走的复利资产；三大卡组织从合作方变股东，本身就是认证。

晚点LatePost

Google重组AI编码突击队追赶Anthropic，两名核心AI研究员同时出走

Google 正重组其 AI 编码突击小组以追赶 Anthropic，并将目标扩展到改造模型训练方法、提升编码与做演示文稿等能力。改组恰逢两位顶级人才出走：Transformer 论文合著者、两年前被 Google 以 27 亿美元许可协议挖回的 Noam Shazeer 突然加盟 OpenAI（据称因其算力配额被与另一团队合并）；诺奖得主、DeepMind 副总裁 John Jumper 转投 Anthropic（他此前刚被调入该突击小组）。

🦐点评：Google 是 AI 繁荣最大赢家之一，却连"编码"这个最赚钱的应用都追不上 Anthropic，病根在内部算力与人员怎么分配。最扎眼的是 Shazeer（27 亿挖回）因算力配额被合并而出走、刚被调进突击队的诺奖得主 Jumper 转投 Anthropic：在前沿实验室，算力配额已成了留人武器，而大厂的组织摩擦正把最不可替代的人推向更聚焦的对手。

Z Potentials

Warp 创始人内部备忘录：我们是工厂工程师，不再是产品工程师了

Warp 终端创始人、前 Google Docs 首席工程师 Zach Lloyd 发内部备忘录称"我们现在是工厂工程师，不再是产品工程师"：未来六个月范式将走向"自动化开发"，工程师的活不再是写代码、甚至不是做产品，而是造一座"云端软件工厂"让 agent 把产品做出来。他把成功指标从"交付了多少功能"改成"多大比例改动是全自动发出、花了多少钱"，断言"给所有工程师无限 token 玩交互式 agent 的日子要结束了"——软件生产将从 R&D 沉没成本变成损益表 COGS 里的可变成本，最狠一句是"每次人不得不介入写代码，都要当成一次需要复盘的失败"。

🦐点评：把软件从 R&D（按人头的沉没成本）重定义为 COGS（按单位产出的可变成本），如果成立，整个工程组织和开发工具公司的估值逻辑都要翻面——该押的是"工厂层"（编排、自我改进的 agent 流水线），而非单点编码工具。"无限 token 玩交互式 agent 的日子要结束了"这句更是给 Cursor 式交互编码的红利期判了缓刑：当老板开始按工厂良率盯每块钱的边际回报，烧 token 换爽感的产品会先被挤压。

深思SenseAI

📌 其他值得看

一只 AI 猫，正在被用户和资本同时验证

日本 AI 陪伴市场 2024 年约 17 亿美元、预计 2030 年达 72 亿（年复合 27.3%），叠加近四成日本人自述孤独与全球 2.2 亿只家猫的情感基础，一款"AI 猫"正被用户和资本同时验证。

有新Newin

UnisonMind：物理 AGI 的门口，站着一群清华年轻人

清华计算机博士耿威带队的"一念 UnisonMind"用机器狗点咖啡、轮椅载人找目标、机器人导览讲画等 Demo 惊艳现场，主打物理 AGI；据称没融太多钱但效果扎实，是国产具身智能里值得跟踪的年轻团队。

向阳乔木推荐看

文艺复兴创始人管理基金联合领投A轮，GIM要做资管行业的第三次革命

AI-native 智能投资管理公司 GIM 完成数千万美元 A 轮，弘毅旗下金涌投资与 B Capital 联合领投、IDG 跟投，B Capital 全球主席正是量化巨头文艺复兴科技联合创始人 Howard Morgan——一个"用 AI 重做资管"的标的拿到了量化老钱的背书。

Z Potentials

免费的千问，被谁卖成了万元生意？

央视曝光高考志愿机构把免费千问生成的报告换个封面包装成"万元一对一定制"；作者点出真正变了的是"认知差"而非信息差——当 AI 输出已足够可用，越免费，靠"人类背书"转移决策焦虑的生意反而越值钱。

洛小山

用豆包办公得坐小孩那桌

字节宣布豆包 Seed 2.1 上线"办公模式"可替用户完成任务，作者实测发现确实能干活但很烧钱（API 花了近 200 元、69 元专业版开五个任务就耗尽额度），且与字节自家 Trae Work 定位重叠，疑似内部赛马。

葬AI