🔥 精选推荐

Anthropic 以 $965B 估值完成 $65B H 轮融资,同时披露年化收入 run-rate 已突破 $470 亿(去年 12 月仅 $90 亿)。同日发布 Opus 4.8,SWE-Bench Pro 达 69.2%(比 GPT-5.5 高 10 分),官方强调模型在自我校准和诚实度上的改进。更具长期意义的是 Claude Code 的"动态工作流"功能——可动态编排数百个并行子 Agent,Jarred Sumner 用该功能在 6 天内将 Bun 从 Zig 重写为 Rust(75 万行代码,99.8% 测试通过率)。
🦐点评:三连发(模型 + 融资 + 产品)是有节奏的信号释放:Anthropic 不只是在做更好的模型,而是在构建从基座模型到开发者工具到企业工作流的完整 stack。$470 亿 ARR 对应 $965B 估值意味着 P/S 约 2 倍——在 hyper-growth SaaS 中这几乎是 value 定价,暗示市场对持续性有折价。Latent Space 提到的一个关键细节:Anthropic 似乎正在分阶段释放 Mythos 级模型,先发安全可控版本(Opus 4.8),再逐步开放更强能力。这种"安全阶梯"策略如果被市场认可,可能成为 Anthropic 区别于 OpenAI 的长期品牌资产。
latent.space
Baseten 和 Fireworks AI 正在进入百亿美元俱乐部,推理基础设施从投资者担忧的"无壁垒夹层"变成了热门赛道。Fireworks 正在以 $150 亿估值洽谈新一轮融资(去年 10 月估值 $40 亿),Baseten 今年 1 月估值已达 $50 亿。推理计算需求随 agentic workload 和长推理链的普及而爆发,投资者对该层的利润率担忧正在消退。
🦐点评:推理层的估值跃升本质上是 agentic AI 架构的"基础设施税"——当 Dynamic Workflows 动辄启动数百个子 Agent,每个 Agent 运行数万 token,推理消耗从线性变成了组合式增长。这解释了为什么 Fireworks 一年内估值涨近 4 倍。但竞争格局值得警惕:Anthropic、OpenAI 都在自建推理优化(Anthropic 此轮融资的一大用途就是推理算力),云厂商也在发力——独立推理公司最终需要回答"为什么客户不直接用模型厂商的 API"这个问题。
newcomer.co
Simon Willison 追踪了 Anthropic 每次融资时披露的 run-rate 数字:2025 年底 $90 亿 → 2026 年 2 月 $140 亿 → 4 月 $300 亿 → 5 月 $470 亿。Axios CEO Jim VandeHei 此前评价"找不到任何行业任何时代有公司以这种速度扩张营收",而那时数字还只是 $300 亿。Willison 用 Opus 4.8 生成的收入增长曲线显示出近乎垂直的加速。
🦐点评:五个月从 $90 亿到 $470 亿——这条增长曲线的斜率比任何 SaaS 公司的历史记录都陡。但 run-rate 是当月收入乘以 12 的年化推算,反映的是即时状态而非累计实收。真正的问题是:这个增速有多少来自企业客户的初始导入(one-time ramp)?如果 token 消耗是突发性的(大规模迁移、实验性项目),增长曲线的二阶导数可能很快转负。对 IPO 定价而言,区分"可持续经常性收入"和"项目制消耗峰值"将是关键。
simonwillison.net
Gary Marcus 汇总了 tokenmaxxing 退潮的最新信号:H200 租赁价格三周内暴跌 40%($7/hr → $4/hr),FT 测算 2025-2030 年超级算力投资回报率仅一家为正,Amazon 撤销内部 AI 使用排行榜以遏制"为用而用"。Marcus 提出两套相反预测:一种是 AI 投资理性化后进入更健康的增长轨道,另一种是泡沫破裂引发资本退潮。
🦐点评:H200 租金三周跌 40% 是一个被低估的先行指标——它暗示 GPU 供给拐点可能已到。如果推理端价格战加剧(DeepSeek 等廉价替代方案已在蚕食市场),独立推理公司的 decacorn 估值叙事和 NVIDIA 的万亿美元 GPU 销售预期都将面临压力。Amazon 撤销使用排行榜这个细节尤其值得注意:说明企业内部 AI 采购正在从"鼓励探索"切换到"管控 ROI"模式。这个转向的时间窗口——2026 年下半年——可能决定 AI 应用层的下一轮洗牌。
garymarcus.substack.com
Ed Zitron 系列分析的第三部分,从纯数字角度拆解 AI 泡沫能否自圆其说:NVIDIA 要实现万亿美元 Blackwell/Vera Rubin 销售目标,全球 AI 推理市场需要达到年 $4350 亿以上的需求规模。系列此前讨论了 token 计费模式转型、企业支出可持续性、数据中心产能瓶颈、VC 断流场景、推理利润率问题,以及 OpenAI/Anthropic 可能出现的"循环融资"收购模式。
🦐点评:Zitron 的框架虽然偏熊,但"反向推演"方法论本身对投资人有价值——从 NVIDIA 的万亿销售预期倒推所需的终端需求规模,再检验这个需求是否合理。$4350 亿年化推理需求意味着什么?大致相当于全球企业软件市场的 60%。即使 AI 真的改变一切,市场达到这个规模需要的时间窗口如果超出 GPU 折旧周期,中间就会出现一个危险的"估值-现实"缺口。这篇文章应该和 Anthropic $470 亿 ARR 的乐观叙事对照阅读。
wheresyoured.at

📌 其他新闻

Gemini 3.5 Flash 是 I/O 的头条模型——速度快但价格不便宜且编码能力平庸。分析认为 Gemini 更像是为 Google 自身产品构建的模型,TPU 优势明显但在 coding agent 赛道存在结构性短板。
martinalderson.com
商业载人航天公司「穿越者」完成 Pre-A 轮亿元融资,由某头部互联网战投领投,探路者等跟投。资金用于"穿越者壹号"载人飞船核心系统研发,定位太空旅游大众化。
36kr.com
文章从反方视角审视 AI coding agent 的成本效益,质疑当前模式是否在用高昂的推理开销解决低价值问题——在 tokenmaxxing 退潮背景下引发行业讨论。
InfoQ 中文
比亚迪发布自研 4nm AI 芯片,制程对齐英伟达,算力超越特斯拉同级产品,主攻智驾场景。芯片自研是比亚迪垂直整合战略的又一关键拼图。
量子位
雷锋网独家解读 Anthropic 三个月估值翻三倍、ARR 升至 $450 亿的驱动因素。多位分析师认为"错过是比买贵更大的风险",市场 FOMO 情绪浓厚。
雷锋网

🧠 AI 技术前沿

cursor_ai @cursor_ai
Cursor 推出 Auto-review 模式,允许 Agent 以更少的审批提示和更安全的沙箱方式执行工具调用——通过分类器子 Agent 决定是否放行。
查看推文 →
emollick @emollick
围绕 AI 重构软件工程需要投入大量工作。组织理想中应把 token 花在两件事上:构建产品,以及探索最佳实践的实验(包括允许失败)。
查看推文 →
emollick @emollick
GPT-5 Pro 系列自去年夏天以来一直是单次尝试最难问题的最佳模型,至今没有真正的竞争对手。
查看推文 →
shao__meng @shao__meng
Grok Build 0.1 已在 Cursor 中可用。
查看推文 →
rileybrown @rileybrown
Codex 现在可以在运行时自行派生新线程——Agent 自主编排子任务能力进一步增强。
查看推文 →

🚀 创业动态

bcherny @bcherny
Salesforce 发布 agentic Claude Code 实践报告:一个原本预估 231 天的迁移项目 13 天交付,单个 PR 完成 21 个端点且测试覆盖率 100%,总事故率反而下降 5%。
查看推文 →
levelsio @levelsio
给酒店搜索网站加入 AI 视觉识别功能,可根据酒店照片内容过滤(如健身房类型、餐食种类),让用户直接看到实景判断质量。
查看推文 →
marclou @marclou
用 Opus 4.8 一次性生成了 4 个新图表(转化率、ARPU、跳出率、会话时长趋势),支持点击切换聚焦视图——one-shot 完成。
查看推文 →
hongming731 @hongming731
BestBlogs 每天处理近 5000 万 token,用 DeepSeek-v4-flash 跑低优先级、v4-pro 跑高优先级,整体日成本约 20 多元人民币,缓存命中率高。
查看推文 →

💬 观点与洞察

shao__meng @shao__meng
活人开发者的注意力是 AI Coding 系统里最稀缺、最慢、不能并行的资源。Agent 可以并行,但人的审查和判断不能——人就是 Agent 系统的 GIL(全局解释器锁),这是 Addy Osmani 所说的"Orchestration Tax"。
查看推文 →
emollick @emollick
Claude 做经济学家的角色扮演表现惊人——完成论文后自评鉴别力 4.5/10,承认"不应声称因果识别",展现出罕见的自我校准能力。
查看推文 →
MengTo @MengTo
Opus 4.8 能设计漂亮的 landing page,但需要大量技巧和精心提示,整体略逊于 GPT-5.5。
查看推文 →
shao__meng @shao__meng
Coding Agent 的能力远不止写代码——让 Cursor 分析代理配置问题,几分钟内诊断修复并自动跑通测试,还额外接入了 DeepSeek API 做故障时的备用方案。
查看推文 →

🔥 精选推荐

ScaleVP 投资人 Siddharth 正面回应"应用层已死"论断:套壳应用确实会死,但模型越强有一类应用公司反而越值钱。区分标准不是"有没有用",而是有没有"包住"一个客户停不下来在意的指标。文章列出了危险区产品的共性——活儿有边界、一句话能说清、一个周末能重搭——以及安全区公司的特征:包住了客户的核心业务指标,且切换成本随使用深度指数级增长。
🦐点评:这个框架对 VC 筛选 AI 应用层标的非常实用——"包住指标"本质上是在问产品有没有成为客户业务流程的控制点。Cursor 包住了开发者的代码产出,Harvey 包住了律师的计费小时——它们都不怕模型升级,因为价值在 harness 和数据飞轮里。对应用层投资人来说,当下最该回避的是"功能明确、边界清晰、模型一升级就被内化"的工具类产品,最该追的是"越用越深、越深越难换"的系统级嵌入。
深思SenseAI
BlackArc AI 创始人 Josh Schultz 的实战总结:超过 70% 的企业 AI 项目卡在"从 demo 到生产"。核心原因不是模型不够聪明,是企业系统没准备好接纳一个会自主决策的组件。Schultz 的核心论断是"系统才是产品"——Agent 只是系统里的一个组件。一个 Agent 进了企业,就像把一个聪明但不懂公司的新人直接扔进最复杂的业务流程。
🦐点评:70% 卡在 demo-to-production 这个数字对 AI infra 和 middleware 赛道有直接估值含义——它意味着市场需求已经从"让 Agent 更聪明"转向"让企业环境对 Agent 友好"。这正是 LangChain/LangSmith、Humanloop、Braintrust 等 Agent 可观测性和编排工具在抢的市场。对投资人来说,这个判断的推论是:下一波 AI infra 的 alpha 不在模型层,而在"Agent-readiness"层——帮企业做好接纳 Agent 的系统改造。
深思SenseAI
Fireworks AI 正洽谈新一轮融资,估值将达 $150 亿,由 Index Ventures 共同领投。公司专注 AI 推理(运行已训练好的模型),去年 10 月以 $40 亿估值完成 $2.5 亿融资,主要竞争对手 Baseten($50 亿)和 Fal($45 亿)估值也在快速攀升。前 Meta 工程师 2022 年创立。
🦐点评:一年内估值从 $40 亿到 $150 亿——推理层的重估速度甚至超过了模型公司。但推理服务本质是计算密集型基础设施生意,其毛利率结构更接近 CDN 而非 SaaS。当 Anthropic 一轮融 $650 亿、其中大量资金投向自有推理基础设施时,独立推理公司的"夹层"风险并没有消失,只是被短期需求爆发暂时掩盖了。
Z Potentials

📌 其他值得看

Cognition(Devin)D 轮融 $10 亿+,估值 $260 亿,ARR 从去年 5 月 $3700 万增至 $4.92 亿。Lux Capital、General Catalyst 和 8VC 领投,客户包括高盛和梅赛德斯-奔驰。
Z Potentials
Cursor 首份开发者报告关键数据:头部用户的 AI 代码产出和 token 消耗远高于中位数且差距扩大,input/output token ratio 大幅上升(AI 读得越来越多),缓存成为成本关键,PR 变大、手动 diff 审批变少。
歸藏的AI工具箱
前 Salesforce AI 研究所工程负责人创业,推出 CHI Bench 评估医疗场景 Agent 能力——发现 Agent 能回答问题不代表能完成工作,从 demo 到生产的鸿沟在医疗领域尤为突出。
Z Potentials
阶跃星辰开源 Step 3.7 Flash:MoE 架构,196B 总参数 / 11B 激活,支持视觉理解,为 Agent 场景优化,推理速度达 400 token/s。
赛博禅心
分析认为 Claude Code 动态工作流(并行子 Agent 编排)的产品意义大于 Opus 4.8 的模型升级本身——多 Agent 协作的工程范式正在从理论走向开发者日常。
歸藏的AI工具箱