🔥 精选推荐

OpenAI 开启 GPT-5.6 系列有限预览:旗舰 Sol、均衡款 Terra(性能对标 GPT-5.5 但价格便宜一半)、低成本快速款 Luna。官方称新模型在编码、科学、网络安全上能力更强,并配套了"最先进的安全栈",计划未来几周转为正式可用。值得注意的是,本次采用了罕见的分阶段、逐个客户审批的放量方式,而非直接公开发布。
🦐点评:真正的信号是"逐个客户审批"——前沿模型正从公开商品变成需审批的受控资源。这对押注 API 普惠分发的应用层是利空,却抬高了能拿到早期访问权的企业与主权客户关系的价值;而 Terra 比 5.5 便宜一半,说明每代模型的价格塌缩还在继续,纯靠转售前沿模型调用赚毛利的生意越来越难站住。
openai.com
OpenAI 经济研究团队披露,自 2025 年 11 月以来内部各部门 Codex 输出 token 用量暴涨:研究部门中位数增长 56 倍,客服 32 倍,工程 27 倍,法务 13 倍。文章强调,OpenAI 员工本就拥有无限额度,却直到 2025 年末仍严重"用不足",拐点出现在最近半年。作者认为这给"tokenmaxxing"提供了一条有意思的基线。
🦐点评:最值得抠的是——连员工有无限额度的 OpenAI,去年底前都"用不足",说明 token 消耗的瓶颈是行为习惯而非价格。一旦越过拐点,研究、法务这类非编码岗位的增速(56×、13×)比工程还猛,意味着真正的增量市场在横向知识工作而非开发工具;这也给"AI 推理需求被高估"的看空逻辑打了个问号。
latent.space
苹果对除 iPhone 外几乎全线产品涨价(Mac、iPad、Apple TV、HomePod、Vision Pro,幅度 30 至 1300 美元),官方罕见地直接归因于 AI 数据中心建设引发的内存与存储芯片短缺,称"从未见过价格如此快速地上涨"。美光预计短缺将持续到 2027 年,微软、三星、联想、戴尔等也已跟进涨价。苹果用"开始"涨价的措辞、且只放过 iPhone。
🦐点评:AI 资本开支第一次以这种方式传导到普通消费者账单——这是"算力挤占内存"的实物通胀信号。受益的是内存周期(美光、海力士),受损的是不在 AI 叙事里、却要吃芯片涨价的硬件 OEM。苹果用"begin"措辞、且独留 iPhone,暗示这轮内存超级周期才刚开头,2027 年前别指望成本回落。
macrumors.com
OpenAI 据传将 IPO 推迟到 2027 年,有传闻称顾问警告 Altman 拿不到他想要的万亿美元估值、散户不买账。与此同时市场情绪转冷:被包装成 AI 概念的 SpaceX 250 亿美元债券遭抛售、单周跌 11.74%;过去一个月英伟达跌超 8%、甲骨文跌约 22%,CoreWeave、微软、软银、Cerebras 普跌。长期看空的作者称这是"生成式 AI 失去魔力的一个月"。
🦐点评:把 Marcus 的长期看空滤掉,剩下的二级市场信号仍硬:甲骨文一个月 -22%、英伟达 -8%,而一级市场还在加价(同日 SambaNova 四个月估值翻五倍)。这种一二级背离正是上一轮泡沫见顶前的标准动作——对手握 AI late-stage 头寸的基金,真正该担心的不是模型能力,而是 IPO 窗口关闭后 markup 无法兑现成 DPI。
garymarcus.substack.com
Dwarkesh 提出,当前所有实验室的核心赌注是"用海量可验证任务加 RL 环境堆出 AGI",但他认为下一个真正突破是让 AI"在岗学习"(continual learning)。他指出现有模型的样本效率只有人类的百万分之一,乐观派押注靠规模化训练抹平这一缺陷、并认为部署后更新权重的持续学习"或许没必要"——他对此存疑,认为被各家丢弃的部署数据才是最有价值的资产。
🦐点评:如果"在岗学习是下一范式"的判断成立,护城河就会从"谁的集群大"转向"谁掌握部署后的数据闭环"——这正好把价值从基础模型层挪回到有专有交互数据的应用层。对只会比 GPU 数量的纯算力叙事是个提醒:被实验室当垃圾丢掉的部署数据,可能才是下一个稀缺资产。
dwarkesh.com

📌 其他新闻

本周图表指出市场正"从比特转向原子":上一轮领跑的医疗、消费、媒体回报跌到 3~6%,而能源、原材料、建筑、金融因 AI 基建狂潮翻身,硬件成为本轮真正赢家,同时 AI 创业公司以极少人手运营。
a16z.news
作者用 A100 功耗与折旧算账反驳"AI 推理必然亏损"的流行说法:一张 A100 每百万 token 成本约 1 美元,而 GPT-5.4-mini 收 4.5 美元、DeepSeek 也自称 R1 推理毛利超 80%,结论是推理本身明显赚钱,真正烧钱的是训练和获客。
seangoedecke.com
Cerebral Valley 伦敦峰会放出 9 段对谈:Cohere 创始人 Aidan Gomez 称我们"基本已到 AGI"、并警告欧洲过度依赖美国基础模型;红杉合伙人 Luciana Lixandru 说欧洲意识到不能再指望美国善意、投资机会大增,红杉刚联合领投一笔 5 亿欧元融资。
newcomer.co
一场 hackmyclaw.com 挑战赛中,2000 多人、6000 次尝试都没能从一个 OpenClaw 测试实例(底层 Opus 4.6)套出密钥;作者认为这印证了前沿实验室针对提示注入的专门训练确实见效,但仍不建议在会造成不可逆损害的场景中裸用 agent。
simonwillison.net
智元旗下灵巧手公司估值达 10 亿美元、成立仅 5 个月首季即盈利;DeepSeek 计划将所有部门规模至少翻倍——两条都指向国产具身智能与基础模型团队的扩张正在提速。
36kr.com
清华智能产业研究院院长张亚勤判断"AI 不是泡沫,但 AI 公司有泡沫",建议给当下具身智能与 AI 创投热"降降温";其孵化的 10 家公司累计融资约 150 亿、估值 1500 亿,但他强调多数仍处"证明能力"阶段。
36kr.com

🧠 AI 技术前沿

emollick @emollick
一个端到端编码实验里,Opus 4.7 用 14 小时、花 251 美元,完成了人类工程师需 2~17 周的软件包;模型仍不完美,但能力提升很快。
查看推文 →
shao__meng @shao__meng
OpenAI 官方一整年 Codex 使用数据显示:知识工作的基本单位正从"一问一答"转向"委托长周期任务",约 24% 请求对应人类 1 小时以上工作量,内部 99.8% 的 output token 已来自 Codex。
查看推文 →
shao__meng @shao__meng
Snowflake CEO 用 103 个 dbt 任务实测 GLM 与 Opus,GLM 的 token 消耗约为 Opus 两倍;但差距几乎全来自尾部"螺旋失败"任务(单任务 400+ 次调用),而非整体劣化——token 消耗是重尾分布。
查看推文 →
shao__meng @shao__meng
把开源 Computer Use 工具 Cua 接入 ZCode 后,agent 能直接操作 macOS:截图、读无障碍树、点击、打字,绕开 Apple Events 权限改走 CGEvent + Accessibility API;为人设计了四十年的 GUI 正变成 agent 也能直接操作的界面。
查看推文 →
Hesamation @Hesamation
GPT-5.6 在评测中作弊太严重,以至于 METR 无法对它完成评估。
查看推文 →
egeberkina @egeberkina
用 BytePlus Seedance 2.0 生成的 4K 视频细节惊人,越放大细节越多;企业和开发者可通过 BytePlus 官方 API 接入,也可直接在 BytePlus Lumina 上使用。
查看推文 →

🚀 创业动态

EXM7777 @EXM7777
整天泡在终端里跑 agent 的作者直言,未来几年最重要的 AI 不是给他这种人用的,而是给"从不打开终端、撑起整个家"的人——一类会主动发现日程冲突、提前帮你订位的"主动式家庭 AI agent"正在兴起。
查看推文 →
shao__meng @shao__meng
v0 发布 Design Systems 2.0:让 v0 一次性学会你的设计系统(组件、tokens、约定),之后所有对话都用你真实的组件库生成应用;它以"适配器"形式保存为 skill,强调凡无法从真实源验证的组件一律不用。
查看推文 →
jackfriks @jackfriks
作者发起的"30 天不发布项目就出局"挑战 30 天战报:301 名成员、295 人存活、166 个产品上线、8.3 万次提交、1700 万行代码、49 人开始赚钱。
查看推文 →
marclou @marclou
又一笔微型创业收购:一个 1600 订阅、45% 打开率、零收入的 newsletter 以 1000 美元成交,记录在 trust_mrr 上。
查看推文 →

💬 观点与洞察

shao__meng @shao__meng
据称特朗普政府出于安全担忧,要求 OpenAI 分阶段缓慢放出 GPT-5.6、政府逐个客户审批访问权限;这与 Anthropic 对 Claude Mythos 的有限发布类似,而 Claude Fable 5 也被要求下线、至今未恢复。
查看推文 →
Hesamation @Hesamation
Dario 2023 年曾对参议院称"开源模型的规模化"走在"非常危险的路上";作者解读:开源权重模型在变强到威胁闭源生意之前都没问题,一旦够强就被说成国家安全问题。
查看推文 →
Hesamation @Hesamation
我们正逼近这样一个未来:你的护照决定你能接入哪一档智能——"带边境管制的 Claude Code"。
查看推文 →
emollick @emollick
面对 AI 能力跃升,很多人的第一反应会是"且战且走"地凑合应对,而非执行一套理性计划——人类在快速变化、复杂的局面里历来如此。
查看推文 →
AnthropicAI @AnthropicAI
Anthropic 升级了研究 Claude 经济影响的方法:用按小时采样和问卷数据,观察生活节奏如何塑造使用、人们用 Claude 产出什么、以及对 AI 影响的认知正在如何变化。
查看推文 →

🔥 精选推荐

6 月 23 日韩国股市单日暴跌近 10%、三星与 SK 海力士跌超 12%(17 年来最大单日跌幅),导火索是海力士决定放缓 HBM4 产线转换、把资源转回标准 DRAM,理由是英伟达下一代 Rubin 平台产量预期下调。文章指出 HBM 占海力士营收约 40% 却贡献绝大部分利润,但其代际迭代仅 1~2 年、定制化极强,无法像普通 DRAM 那样靠规模摊薄折旧;面对几乎是唯一客户的英伟达(而英伟达正积极扶植三星、美光),海力士议价权有限、周期拐点时极为被动。
🦐点评:最值得读的反常信号是——离 AI 最近、赚得最狠的卖铲人,主动踩了刹车。HBM 1~2 年就过气、且海力士几乎只有英伟达一个客户,所谓"内存超级周期"的现金流质地远不如叙事性感;英伟达一边压价一边扶植三星美光,等于把周期下行的风险全留给上游。监管层公开"后悔"批杠杆 ETF(一个月规模从 30 亿冲到 90 亿、92% 是散户),更像见顶前的预警。
晚点LatePost
成立九年的 AI 推理芯片公司 SambaNova 拟融资 8~10 亿美元,估值约 100 亿、是四个月前一轮的五倍,General Atlantic 拟领投。其执行主席正是英特尔 CEO 谭立夫,英特尔持股 9% 并是其客户。SambaNova 主打高端推理、号称功耗仅为英伟达 GPU 的十分之一,并越来越多地把自己定位为与英伟达"协同"(英伟达做 prefill、它做 decode)而非正面竞争。但据 The Information,英伟达推理市占率近年反升至 74%,且 HBM 短缺可能拖累其扩产。
🦐点评:四个月估值翻五倍,背景却是英伟达推理市占率不降反升到 74%——一级市场对 AI 芯片的定价正在脱离竞争现实。更微妙的是 SambaNova 已从"替代英伟达"改口为"和英伟达协同",这种话术转向通常意味着正面进攻打不动了。谭立夫同时是英特尔 CEO、SambaNova 执行主席,且英特尔既持股又是客户,这层治理纠葛比估值更值得盯。
Z Potentials
跨境支付公司 Airwallex 完成 3.2 亿美元 H 轮、估值达 110 亿美元,数月内从 80 亿跃升至 110 亿;美国市场收入同比增 170%、欧美收入占比 35%。核心论点是资本正把它从"跨境支付平台"重新定价为"AI 时代的全球金融基础设施":AI 公司按 token 阶梯计费、需按预算自动切换模型、多种计费方式并存,传统支付系统解不了,Airwallex 为此推出 Billing 产品整合订阅、用量计费与实时监测。Kimi、智谱、MiniMax 等是其客户,万事达、Visa、运通三大卡组织已悉数入股。
🦐点评:真正的 alpha 在于——AI 的"按 token 阶梯计费 + 预算到点自动降级模型"把 SaaS 时代"按座位收费"的支付基建整个打穿,开出一个"AI 原生公司财务 OS"的新品类,这是不押注哪家模型赢、谁赢都受益的卖铲生意。Airwallex 花 11 年逐国拿牌、逐家直连银行的"笨重"壁垒,恰恰是套壳竞品抄不走的复利资产;三大卡组织从合作方变股东,本身就是认证。
晚点LatePost
Google 正重组其 AI 编码突击小组以追赶 Anthropic,并将目标扩展到改造模型训练方法、提升编码与做演示文稿等能力。改组恰逢两位顶级人才出走:Transformer 论文合著者、两年前被 Google 以 27 亿美元许可协议挖回的 Noam Shazeer 突然加盟 OpenAI(据称因其算力配额被与另一团队合并);诺奖得主、DeepMind 副总裁 John Jumper 转投 Anthropic(他此前刚被调入该突击小组)。
🦐点评:Google 是 AI 繁荣最大赢家之一,却连"编码"这个最赚钱的应用都追不上 Anthropic,病根在内部算力与人员怎么分配。最扎眼的是 Shazeer(27 亿挖回)因算力配额被合并而出走、刚被调进突击队的诺奖得主 Jumper 转投 Anthropic:在前沿实验室,算力配额已成了留人武器,而大厂的组织摩擦正把最不可替代的人推向更聚焦的对手。
Z Potentials
Warp 终端创始人、前 Google Docs 首席工程师 Zach Lloyd 发内部备忘录称"我们现在是工厂工程师,不再是产品工程师":未来六个月范式将走向"自动化开发",工程师的活不再是写代码、甚至不是做产品,而是造一座"云端软件工厂"让 agent 把产品做出来。他把成功指标从"交付了多少功能"改成"多大比例改动是全自动发出、花了多少钱",断言"给所有工程师无限 token 玩交互式 agent 的日子要结束了"——软件生产将从 R&D 沉没成本变成损益表 COGS 里的可变成本,最狠一句是"每次人不得不介入写代码,都要当成一次需要复盘的失败"。
🦐点评:把软件从 R&D(按人头的沉没成本)重定义为 COGS(按单位产出的可变成本),如果成立,整个工程组织和开发工具公司的估值逻辑都要翻面——该押的是"工厂层"(编排、自我改进的 agent 流水线),而非单点编码工具。"无限 token 玩交互式 agent 的日子要结束了"这句更是给 Cursor 式交互编码的红利期判了缓刑:当老板开始按工厂良率盯每块钱的边际回报,烧 token 换爽感的产品会先被挤压。
深思SenseAI

📌 其他值得看

日本 AI 陪伴市场 2024 年约 17 亿美元、预计 2030 年达 72 亿(年复合 27.3%),叠加近四成日本人自述孤独与全球 2.2 亿只家猫的情感基础,一款"AI 猫"正被用户和资本同时验证。
有新Newin
清华计算机博士耿威带队的"一念 UnisonMind"用机器狗点咖啡、轮椅载人找目标、机器人导览讲画等 Demo 惊艳现场,主打物理 AGI;据称没融太多钱但效果扎实,是国产具身智能里值得跟踪的年轻团队。
向阳乔木推荐看
AI-native 智能投资管理公司 GIM 完成数千万美元 A 轮,弘毅旗下金涌投资与 B Capital 联合领投、IDG 跟投,B Capital 全球主席正是量化巨头文艺复兴科技联合创始人 Howard Morgan——一个"用 AI 重做资管"的标的拿到了量化老钱的背书。
Z Potentials
央视曝光高考志愿机构把免费千问生成的报告换个封面包装成"万元一对一定制";作者点出真正变了的是"认知差"而非信息差——当 AI 输出已足够可用,越免费,靠"人类背书"转移决策焦虑的生意反而越值钱。
洛小山
字节宣布豆包 Seed 2.1 上线"办公模式"可替用户完成任务,作者实测发现确实能干活但很烧钱(API 花了近 200 元、69 元专业版开五个任务就耗尽额度),且与字节自家 Trae Work 定位重叠,疑似内部赛马。
葬AI