🔥 精选推荐
Google 发行 $850 亿新股为数据中心扩建融资——这是一家多年持续回购股票的高盈利公司突然转向增发,信号极不寻常。SpaceX 下周 IPO 目标 $750 亿、估值 $1.75 万亿,但 S&P 指数最终没有为其破例修改规则。Benchmark 募集首支 $20 亿成长基金;VC 基金的中位 TVPI 终于开始回升。特朗普新 AI 行政令对行业更友好。Airbnb 的 Brian Chesky 宣布成立 AI 实验室。数据中心建设面临严重延期。
🦐点评:Google 一边账上现金充裕一边增发 $850 亿,核心逻辑是用股权而非债务锁定 AI 基建投入的风险——这等于告诉市场"我们认为这笔 capex 的回报周期足够长,值得稀释股东"。更值得关注的对比是:Google 和 Microsoft 都是从利润中挤 capex,而 OpenAI、Anthropic 还在用融资烧钱建算力。如果后者 IPO 后也被迫增发,AI 基建的资金成本会集体上升,这对所有下游 AI 应用公司的定价权都是压力。
Ben Thompson 本周聚焦 Google 与 Microsoft 的攻守转换:三年前 Google 面对 ChatGPT 手忙脚乱,Microsoft 借 OpenAI 合作一时风头无两。如今 Google 市值拉开差距,却选择向 Berkshire Hathaway 定增——Thompson 在 The Google Capital Company 一文中试图解读这一反常操作。Microsoft 方面,Nadella 在访谈中被直接问到:他对微软的竞争位置满意吗?另外两个有趣话题:Gen Z YouTuber 击败星球大战外传登顶北美票房,以及 NBA 总决赛观赛指南。
🦐点评:Google 向巴菲特定增是一个精心设计的信号——既锁定了最保守的长线资本背书,又避免了在公开市场大规模增发的股价冲击。更深层的权力转移是:三年前 Microsoft 凭 OpenAI 独家合作建立的叙事优势已经瓦解,现在 OpenAI 反而成了它的战略负担(MAI 模型 + RKLD 本质是在"去 OpenAI 化")。Google 的优势正从"有模型"变成"有分发"——Search + Android + YouTube 的 Gemini 嵌入是 OpenAI 和 Anthropic 都无法复制的。
Gary Marcus 拆解 Anthropic 引发热议的"When AI builds itself"博客:Anthropic 声称 Claude 正在加速 AI 研发,暗示递归自我改进(RSI)路径可能实现。Marcus 的核心论点是 RSI ≠ AGI——Anthropic 展示的只是 AI 作为编码工具的效率提升(人类可控),而非自主完成人类所有工作的通用智能。他认为这是一种"bait and switch":用 RSI 的进展制造恐慌情绪,实际上离 AGI 仍需全新的想法,而非仅靠代码优化。此外,S&P 500 最终没有为 SpaceX 修改快速纳入规则,Marcus 认为这是好消息。
🦐点评:Marcus 的拆解触及一个 VC 必须厘清的认知:Anthropic 同时在玩两张牌——对投资人讲"我们的模型能力在指数增长",对监管讲"AI 太危险了需要放慢"。这两个叙事都在为同一个目的服务:巩固 Anthropic 的护城河,无论是通过融资还是通过监管壁垒。RSI 确实在发生(coding 效率翻倍是真的),但从 coding 加速到 AGI 之间的鸿沟,比从 GPT-2 到 ChatGPT 还大。
a16z 本周三组数据图值得关注:(1) RTO 停滞——全美写字楼工作日到访量仅恢复到疫情前 70%,空置率攀升至 14%(金融危机以来最高),但近十年新建办公楼的净吸纳量显著为正,老旧楼宇则持续失血。(2) AI SMB 重度用户画像——小企业中 AI 重度用户的生产力提升显著,但 token 消耗呈非线性增长。(3) 生物科技小型化趋势——"Lil' Biotech" 概念持续发酵。
🦐点评:办公空间的"新旧分化"叠加 AI 对远程办公的加速效应,意味着商业地产正在经历一次结构性而非周期性的重定价。对 VC 来说,更值得深挖的是 AI SMB 数据——重度用户 token 消耗的非线性增长暗示当前的"按座位订阅"模式将普遍失效,usage-based billing 会成为 AI SaaS 的默认定价模型。谁能最先解决"重度用户亏钱、轻度用户补贴"的问题,谁就能在 AI 应用层建立定价权。
📌 其他新闻
Google 五月 AI 总结:正式进入"Agentic Gemini"时代——发布 Gemini 3.5(面向 Agent 和编码的前沿智能)和 Gemini Omni(多模态输入生成视频),推出 Android Halo(手机端 Agent 管理界面)、Universal Cart(跨服务购物车)、Google Health 应用和 Fitbit Air。硬件方面发布 Googlebook 笔记本和智能眼镜。
Gary Marcus 指出 Hassabis 的 AGI 时间线自相矛盾:6 月在斯坦福说"2030 年前后",而 1 月在达沃斯说"2031-2036"。五个月内预测提前了 5 年。Marcus 认为 AGI 定义正被用作营销工具,Hassabis 坚持的"能通过 90% 经济价值相关任务"标准本身就未被验证。
前 Gemini RL 工程师 Auriel Wright 的实战吐槽:RL 数据供应商的环境质量正在拖垮模型训练。常见问题包括不读 trajectory、没有领域专家、不做经济权衡、触发 eval awareness。核心观点是"你的坏 harness 不是没帮上忙,而是在主动让模型变差"。
在 Hugging Face Build Small Hackathon 上,开发者用 Qwen2.5-3B 构建了一个五个 AI Agent 参与的经济模拟。3B 模型 JSON 格式化 100% 成功率但经济判断很差,通过设计稀缺性(食物腐烂、冬季燃料危机)和精准 prompt 工程解决。引入历史金融事件(郁金香泡沫、银行挤兑)后,Agent 出现了非脚本化的恐慌抛售行为。
Ladybird 浏览器宣布不再接受公开 PR。创始人 Andreas Kling 解释:AI 生成代码的涌入使得"一个大补丁意味着大量投入"的假设不再成立,review 成本指数级上升。开源项目面对 AI 生成 PR 泛滥的治理困境正在扩散。
Nieman 实验室用 Claude 抓取 18 家大型媒体的 200 条推文数据分析发现:X 平台正在系统性地压制包含外链的推文。这与 X 从"链接分发平台"转向"封闭内容平台"的战略一致,对所有依赖 Twitter 导流的媒体和内容创业者都是警告信号。
🧠 AI 技术前沿
Anthropic 科学博客新文:Opus 4.7 在 NMR 光谱分析任务上匹配甚至超越了专用软件,正式涉足化学领域的 AI 应用。
查看推文 →
Cursor 发布 Design Mode:可以通过指向、绘图或语音来更新 UI,缩小用户视觉感知和 Agent 理解之间的差距。
查看推文 →
OpenAI 播客披露了用 AI 反证 Erdős 80 年未解的单位距离猜想的细节:模型先查了"unit"的词典定义,证明链的思维过程长达 125 页,数学家最初认为结果一定是错的——但找不到 bug。
查看推文 →
OpenSquilla 采用了与多数 Agent 框架相反的架构思路:核心仅约 100 行代码,只负责决策和分发;模型、记忆、工具全部外置。作者认为这种模块化设计在规模扩展时远优于"所有东西连在一起"的单体框架。
查看推文 →
BestBlogs 早报聚焦腾讯 AI:首席 AI 科学家姚顺雨首次公开亮相,判断 AI 方法论已趋成熟,核心难点从"怎么训练"转向寻找好问题。Hy3 preview 首 token 延迟降低 54%,可驱动最长 495 步 Agent 工作流。
查看推文 →
🚀 创业动态
SpaceX 正在变成 AI 算力帝国:与 Google 签下 $9.2 亿/月、与 Anthropic 签下 $12.5 亿/月的算力合同,Cursor 也在用 Colossus 的算力。Elon 在让竞争对手为他的 $1.75 万亿 IPO 买单。
查看推文 →
Anthropic 宣布 Claude Cowork 用量限额翻倍,为期一个月。适用于 5 小时速率限制。适合处理跨多账号的研究、定期报告和收件箱分类等大型任务。
查看推文 →
Airbnb 创始人 Brian Chesky 正在筹建新 AI 实验室,专注于 UI 和设计模型。
查看推文 →
AI UGC 视频生成价格对比:Google Omni Flash $1.44/60s、Seedance 2.0 $12.3/60s、Kling 3 $6/60s、Grok Imagine $4.7/60s。这些是 API 直调价格,无平台订阅隐藏费用。
查看推文 →
Vibe Jam 2026 游戏已被超过 100 万人玩过,X 上获得近 5000 万次曝光。
查看推文 →
Cursor 发布了类似 Codex Sites 的 Canvas 功能,内置浏览器体验非常好。作者承认一直低估了 Cursor 作为 Agent 平台的能力。
查看推文 →
用 Codex 自建了一个屏幕录制工具,替代 Screen Studio + CapCut 的工作流。一次录制即可导出 4:3、16:9、9:16 三种比例,自动处理音频和字幕。
查看推文 →
💬 观点与洞察
在快速进步停止之前,追赶 Big Three AI Labs(OpenAI、Anthropic、Google)看起来越来越难。Microsoft 和 Meta 发布的模型还行但不是前沿水平,SpaceX 也没有重新夺回位置,中国模型在进步但仍有差距。
查看推文 →
开源权重模型的前沿水平很大程度取决于中国实验室的持续发布。如果它们停止开源,本地/微调模型的能力将越来越落后于前沿。开源权重在成本攀升的情况下可能不是一个好的商业模式。
查看推文 →
AI 经济学的算术不对:重度用户生产力提升 2 倍但消耗 10 倍的 token。Priceline 称之为"可卡因流行病"。AI 是一台每次冒烟都要收费的蒸汽机。
查看推文 →
Cursor 发布了类似 Codex Sites 的 Canvases 功能。Coding Agent 完全可以吃掉 Lovable、v0、bolt.new 的 AI 建站功能,再结合设计、Debug、部署能力,从产品定义到运维全覆盖。
查看推文 →
Anthropic 内部设计师 Meaghan Choi(Claude Code 设计负责人)分享了用 Claude Code 做产品的完整工作流:在 Excalidraw 开源项目上一句话加 autocomplete 功能,从需求到 PR 全程演示。核心观点是产品节奏被压缩后,工作方式必须跟上。
查看推文 →
🔥 精选推荐
Stripe 高管 Emily Sands 提出一个关键框架转换:Agent 不只是帮人做事的工具,而是正在成为独立的经济主体——它会自己买东西、部署服务、消费 token。Stripe 围绕这个判断推出五个产品:MPP(机器支付协议,让 Agent 无需人类点击即可完成购买)、Link Agent 钱包(消费者授权 Agent 花钱但保留控制权)、Stripe Projects(一条 CLI 命令完成 Agent 部署)、Metronome + Tempo(token 流式计费,用稳定币实时清算)、Radar(防 token 盗窃)。文章特别指出 token 盗窃是 AI 行业最被低估的风险——免费试用被批量脚本薅空、恶意账号注册烧额度。
🦐点评:Stripe 的布局思路是"谁控制了 Agent 经济的支付轨道,谁就控制了 Agent 经济"——和当年锁定互联网支付基础设施的逻辑一脉相承。MPP 作为开放标准是典型的"先做标准再收税"打法。但真正的投资信号在 token 盗窃这个问题上:当 AI 产品的每次调用都有真实边际成本时,"先用后付"模式的信用风险远大于 SaaS 时代。这会催生一个新的 AI 风控赛道——谁能实时评估 Agent 的信用、预测滥用行为,谁就能切入 AI 经济的支付清算层。
腾讯 AI 产业大会上汤道生与首席 AI 科学家姚顺雨近一小时的公开对谈,信息密度很高。姚顺雨(ReAct 架构提出者、前 OpenAI)选择腾讯的核心逻辑:AI 下半场方法论已成熟,稀缺的不是算法而是好问题、Context 和产品场景。他判断 AI 下半场才刚开始,"ChatGPT 和 Claude 不会是唯一的 super app"。技术细节上,Hy3 preview 在 CodeBuddy/WorkBuddy 上首 token 延迟降低 54%,可驱动 495 步复杂 Agent 工作流。关于性价比,姚顺雨说"很多人发现用 OPUS 比用更差的模型更省钱——因为一次做对了"。Co-Design(模型与产品共同进化)是腾讯的核心方法论:元宝的聊天和搜索数据可以迁移到 ima 和 WorkBuddy,形成数据网络效应。
🦐点评:姚顺雨"用 OPUS 反而更省钱"的判断暗示了模型市场的一个反直觉结论——性价比的核心不是单价低,而是一次做对的概率高。这对"打价格战"的中国模型厂商是个警告:如果你的模型需要跑 3 次才对,实际成本是标价的 3 倍。腾讯押注的 Context 壁垒逻辑成立,但前提是微信生态的数据真的能合规地流入模型训练——这在数据隐私监管收紧的环境下是一个巨大的执行风险。
AI Agent 监控初创 Coralogix 完成 $2 亿 F 轮融资,估值 $16 亿,距上轮 $1.15 亿仅 11 个月。Advent 和加拿大养老金 CPPIB 领投,累计融资 $5.5 亿。营收年增超 60%,年化已破 $1 亿,约 30 家客户年支出超 $100 万。CEO 透露超过一半企业客户已通过 AI Agent 或 CLI 接口与平台交互,而非传统仪表盘——"界面层正在被侵蚀"。全球 600+ 员工,印度已成第三大办公地。
🦐点评:CPPIB 这类超长线资本进入 AI 监控赛道,说明市场认为 Observability 不是一个会被大厂吃掉的功能,而是一个独立的基础设施层。更关键的信号是"一半客户通过 AI Agent 交互"——这意味着 Datadog 们引以为傲的仪表盘 UI 可能正在变成"上一代产品形态"。Agent-native 的监控交互范式一旦确立,后进者的追赶窗口会比预期短得多。
📌 其他值得看
三个月内第三轮融资,高瓴创投、五源资本、百度风投等加持。主打"可养成"范式的家庭具身智能,重点投向自研具身世界模型迭代和机器人本体量产。具身智能赛道正从技术演示走向规模化数据闭环。
李沐和 Alex Smola 创立的 Boson AI 与 SGLang-Omni 团队合作,完成 Higgs Audio v3 TTS 的端到端推理支持。该模型面向对话场景,能在低延迟条件下生成自然语音,SGLang 框架是当前开源推理领域的核心基础设施之一。
2026Q1 中国新能源车市场零售量同比下滑 21.1%,但新能源渗透率 5 月预计升至 62%。理想正在从"看得见的配置"竞争转向"看不见的能力"竞争,主动让渡短期利润换取自动驾驶等技术壁垒的重构。