🔥 精选推荐
SpaceX 以 $1.8 万亿估值完成 $750 亿 IPO,成为史上最大 IPO,BlackRock 单笔认购至少 $50 亿,总认购超额 4 倍。Anthropic CEO Dario Amodei 呼吁对训练超过 10²⁵ FLOPs 的基础模型实施类似汽车和飞机级别的政府监管,David Sacks 则批评其为"sophisticated regulatory capture strategy"。OpenAI 正在考虑大幅下调 token 价格以应对竞争压力,Databricks 据报也在筹备新一轮私募融资。AI 创业公司 Poetic 获 Kleiner Perkins 领投的 $5000 万 A 轮。
🦐点评:SpaceX IPO 的真正看点不是火箭——Morgan Stanley 给出的 2040 年 $3.4 万亿收入、80% 利润率预测,本质上是在为 xAI 太空数据中心定价。如果公开市场愿意按这种叙事给 SpaceX 估值,OpenAI 和 Anthropic 的 IPO 定价天花板可能比任何人想的都高。反过来说,SpaceX 上市后如果破发,整个 AI lab 的 IPO 窗口都会收紧。
Ben Thompson 本周回顾三条主线。Apple 终于在 WWDC 2026 交付了真正可用的 Siri AI——演示慢到不可能造假,对比两年前的 vaporware 是实质性进步。Anthropic 的 Fable 5 因暗中限制 AI 研究用途引发社区反弹后一天内撤回政策,Thompson 认为这种行为正是他此前批评 Anthropic 对政府立场时所预见的。第三条线是欧盟与中国贸易摩擦升温,G7 和布鲁塞尔峰会前各方加速博弈。
🦐点评:Thompson 对 Apple Intelligence 的判断值得重视——"不惊艳但能用"在消费市场可能就够了,跟 Waymo 的路径一样。对 VC 的含义是,agent 赛道的竞争可能不是"谁模型最强",而是"谁先做到可靠部署进 10 亿部设备"。Apple 的渠道优势一旦和"足够好"的 AI 结合,对所有第三方 AI 助手都是存在性威胁。
美国制造业出现了一个 "boom-let"——订单和产能数据都在回升,但远不是真正的再工业化。核心瓶颈是 capital stock 问题:各主要工业品类中,进口增速超过了设备和厂房的资本存量增速。设备和结构投资占 GDP 比重自 80 年代以来持续下降,即使近年设备投资增速接近 9%,也主要被 AI 相关需求拉动。非 AI 核心工业机械投资约一半是涡轮机和暖通,另一半可能也与半导体相关。
🦐点评:这组数据揭示了一个投资盲区——所有人都在投"做东西"的公司(AI 芯片、模型、应用),但几乎没人在投"做东西的东西"(制造设备、工厂基建)。capital stock 的缺口意味着硬件制造规模化可能比预期慢得多。对中国投资者来说反面信号同样值得关注:如果美国再工业化速度不及预期,中国供应链的替代性短期内没那么容易被削弱。
Karpathy、Steinberger、Boris Cherny 三人不约而同提出同一主张:不要再亲自 prompt AI agent,而是设计让 agent 自主运行的循环(loop)系统。Karpathy 原话是"我不想当研究员在回路中,我在拖后腿"。Latent Space 将此总结为"Salty Lesson"——对应 Sutton 的 Bitter Lesson:不要自己修问题,把精力放在随 agent 数量扩展的系统上。文章同时汇总了 Fable 5 首周社区反馈:FrontierSWE 排名第一、部分任务可持续工作近 20 小时,但成本高昂、安全回退和输出泄露"neuralese"等问题突出。
🦐点评:"Salty Lesson"可能是今年最重要的 AI 方法论概念——工程师的核心竞争力从"写好代码"变成"设计好循环"。对投资来说,判断一家 AI 公司的天花板可以直接看它在哪一层循环上运作:做内层循环(单次任务执行)的公司容易被模型进步吞没,做外层循环(编排和目标系统)的公司更有防御性。
📌 其他新闻
Allen AI 发布 olmo-eval,面向 LLM 开发循环的评测工作台。与一次性跑分不同,它把 benchmark 逻辑和运行策略解耦,支持逐问题级别的检查点对比,帮助分辨真实改进和统计噪声。
KPMG 撰写了一份描述企业成功使用 AI 的报告,但其中的案例研究被 FT 揭露是 AI 幻觉编造的。用 AI 编造 AI 成功案例——2026 年最讽刺的循环论证。
Simon Willison 引用了一则讽刺寓言:Jenny 开火葬场,John 的丙烷公司投资 200 亿、Jenny 把 100 亿扔进焚化炉再付 100 亿买丙烷烧钱、John 报告 AI 投资产生 100 亿收入——Forbes 记者写了篇热情报道。AI 经济学的循环自证被浓缩进一段话。
Anthropic 24 小时内连发三个版本(v2.1.174-176),修复 Fable 5 自动模式回退、Remote Control 断连、后台 session 等多项问题。一天三个 release 的节奏说明 Fable 发布后生态适配压力不小。
SpaceX 确定发行价募资 $750 亿创史上最大 IPO;92 年技术极客陈宇森接任钉钉 CEO;中央网信办开设"涉 AI 应用乱象举报专区"。
在"Agents' Last Exam"基准测试中,Claude Fable 5 在 agent 场景下的表现意外落后于 GPT 5.5,暗示模型在自主决策链路上的能力差异不能简单看静态 benchmark。
🧠 AI 技术前沿
FlashMemory 论文提出神经内存索引器,预判生成时需要的 KV Cache 片段并预加载,将 DeepSeekV4 百万上下文的显存占用从 10GB 压缩到 1.3GB,效果不降反升。
查看推文 →
Kimi K2.7 Code 发布,在 K2.6 基础上针对编程 Agent 专项优化,Kimi Code Bench v2 相比 K2.6 提升 11%。架构不变,属于后训练优化版本,适合编程和需要外部 Agent 验证的任务。
查看推文 →
K2.7 Code 三项编码基准均有提升但未登顶——与 GPT-5.5、Opus 4.8 差距缩小。亮点是 MCP Mark Verified 达 81.1 超过 Opus 4.8 的 76.4,MCP 工具调用成为差异化优势。
查看推文 →
SpenseGPT 提出实用的 one-shot 剪枝方法,能同时启用稀疏和稠密 GEMM 加速 LLM 推理,兼顾压缩率与实际推理速度。
查看推文 →
论文发现通用 Frontier LLM 在三项医疗评估中全面优于专用临床 AI 工具(如 OpenEvidence),后者表现仅与 Google 搜索 AI Overview 相当。
查看推文 →
🚀 创业动态
按 API 定价计算,全职使用 Fable(每周 40 小时)年化成本高达 $124.8 万。AI 能力虽强,但 token 经济性仍是规模化的主要障碍。
查看推文 →
10 个月后重新用 Claude Code + Fable 5 重建已失传的模拟游戏 SimRefinery,仅用一个 prompt 就生成完整可玩版本,包括学习模式和各种复杂机制,与去年版本对比差异巨大。
查看推文 →
OpenAI Codex 推出可"银行储存"的速率限制重置和邀请好友双方各获额外重置——典型的拼多多式增长拉新策略,被调侃为"帮砍一刀"。
查看推文 →
Appshots 让 Codex 能看到用户的整个窗口(包括滚动区域外内容),用户与 Agent 之间的摩擦进一步趋近于零。
查看推文 →
华为开发者大会 HDC 2026 上余承东宣布 openPangu 2.0 开源升级,喊话"字典里没有第二,只有第一"。
查看推文 →
💬 观点与洞察
Meta 先推出 AI 使用排行榜鼓励员工多用 AI、裁了 8000 人说把钱投 AI,现在因为 token 消耗太快不得不限额分配每个员工的 AI 用量。
查看推文 →
对 Anthropic "coding is solved" 叙事的反驳:Claude 仍有 flicker 问题未修(追溯到 2025 年 2 月)、session 泄露、神秘错误消息、稳定性波动。引领"软件已解决"叙事的公司自身关键软件问题不少。
查看推文 →
社区 24 小时内对 Fable 5 收敛出的共识:给更难的目标、少给步骤;让它当指挥不当苦力;免费窗口内固化经验为 Skill。把它当"更听话的 GPT"用会又贵又慢。
查看推文 →
"如果有人问你做的事大厂也做怎么办?我会回答:我们的竞争力就是不宫斗。阿里宫斗,顾不上我们。"
查看推文 →
用 Fable 5 写 spec、让 Opus 4.8 执行实现——71 分钟后 iOS 和 Android 原生应用同时搞定,一次通过。Fable 做规划、Opus 做执行的分工模式初见成效。
查看推文 →
🔥 精选推荐
晚点访谈加速进化 CEO 程昊。核心判断是:当前具身智能不该过早押注端到端大模型和工厂/家庭泛化场景,而应先用机器人足球这样的最小闭环验证运动、感知、决策和多机协作能力。加速进化的路径是先做机器人本体、操作系统和开发工具,把上层 Agent 与硬件解耦,目标成为具身智能的“安卓”。公司已出货千台级小人形机器人,重点放在教育、科研、赛事和海外市场,而不是短期讲工厂替人故事。
🦐点评:这篇的价值在于反共识。具身赛道多数公司在讲“端到端大模型 + 工厂 + 家庭”的宏大叙事,程昊讲的是更脏但更现实的路线:用窄场景换真实数据,用教育和开发者生态换现金流。如果 Booster Studio 真能跨硬件沉淀开发者,价值就不只是硬件公司,而是具身 OS 入口。
文章系统复盘 Agent Skill 的产品形态:Skill 不是一个 prompt,而是把流程、工具、模板、经验、gotchas 和审美判断封装成可复用能力包。作者提出 “Thin Harness, Fat Skills”——Agent 底座保持薄,把行业 SOP、脚本、资产、失败经验和 eval 放进按需加载的 Skill 目录。好 Skill 的关键不是把文档写长,而是把真实失败样本、边界条件和稳定产出骨架沉淀下来。
🦐点评:这篇基本说中了 Agent 产品的中间层机会。模型能力继续上涨后,裸 prompt 会越来越不值钱,真正可复用的是“能稳定交付某类结果的组织方式”。Skill 既是工具,也是分发单元、内容资产和个人/团队经验的商品化形式。对创业者的启发是:不要只做 Agent shell,应该把具体场景里的 dirty work 做厚。
文章讨论 AI 录音和转写正在让公司内部沟通默认变成可搜索、可分析、可追踪的数据层。会议纪要、销售电话、客户访谈、内部讨论都会被模型处理,催生以 voice 为中心的新软件品类。与此同时,普通员工的隐私、信任和权力关系被明显低估:当每句话都可能被记录、评分和归档,组织行为会被重新塑形。
🦐点评:voice software 可能是 AI native SaaS 里被低估的入口。它比传统知识库更接近真实工作流,也比 CRM 更早捕捉到决策和情绪信号。但这类产品的最大瓶颈不是 ASR 或摘要质量,而是组织接受度和治理边界。谁能同时解决“有用”和“不让员工恐惧”,谁才有机会做成企业级平台。
📌 其他值得看
从 Apple、Nvidia、Amazon、Google、Facebook 到阿里,回看科技公司招股书如何从朴素产品描述演变成改变世界的使命叙事。适合作为科技 IPO 叙事史的轻量索引。
用 10 个片段回顾 SpaceX 24 年工程史和马斯克的硬核执行路径。与今天 RSS 段的 SpaceX IPO 叙事可以互相补充。
晚点梳理美团龙珠的科技投资方法,关键词是“识别眼里有光的人”。看点在于消费产业资本如何切入硬科技和 AI 创业者网络。
延续 Kimi 讨论,重新强调月之暗面短期靠产品和组织优化,长期仍取决于杨植麟能否做出真正开创新版本的模型。
用多模型社会模拟观察不同 AI 文明的自组织结果。娱乐性强,但对“涌现”和“对齐”的讨论有传播价值。
对话模拟计算芯片公司安纳智芯,主张中国不应只追赶 GPU,而应在新计算范式上定义规则。适合跟进 AI infra 非 GPU 路线。
前 Datadog 早期工程师创业,面向 AI coding agent 提供独立云基础设施,反映 agent runtime 和云资源控制正在成为新基础设施层。
xAI 前联合创始人创业做个性化 AI Agent,团队背景覆盖 OpenAI 和 Google DeepMind。值得跟踪其差异化是否来自模型、记忆还是分发。