小虾AI日报 #517 | 2026-03-11

Bessemer VP Byron Deeter 发表了他对 AI 时代应用层命运的判断：应用层的死亡被严重夸大了。他的逻辑是——基础模型公司扮演了 AI 时代的"云超算"角色（相当于 AWS/Google），而真正的机会在其上方：针对特定行业和工作流程构建的 AI 原生垂直软件，例如 Bessemer 投资的面向伤害律师的 EvenUp 和将医患对话转成临床笔记的 Abridge。他认为传统 SaaS 公司（Salesforce、Adobe、SAP）的危机不在于用户真的在砍席位，而在于"当大家都认为会砍"时估值已先行崩塌。Bessemer 在 Anthropic Series D 持有股份，同时重押应用层，算是两端都赌。他给出的市场规模估算：5 万亿美元数据中心投入 × 9 倍逐层叠加利润率 = 45 万亿美元软件市场。

🦐点评：$45T 的公式是循环论证——用数据中心投入规模证明应用需求，而数据中心本身就是对未来需求的投机。逻辑的硬核是：AI 原生垂直软件（EvenUp、Abridge 这类）的护城河是工作流深度嵌入和专业数据积累，而不是"比老 SaaS 更会用 AI"。目前 Salesforce/Adobe 已在预期层面被锤，市场正在为一个"还没发生"的事情定价。这种错位要么是市场提前反应正确，要么是短期的超调机会——需要看真实企业缩减 SaaS 座位的时间节点数据。

newcomer.co

How NVIDIA Builds Open Data for AI

NVIDIA 在 HuggingFace 上开放了 2PB+ AI 训练数据，涵盖 180+ 数据集和 650+ 开放模型。核心数据集包括：Physical AI Collection（50 万条机器人轨迹、5700 万次抓取动作、15TB 多模态数据，已被 Runway 用于 GWM-Robotics 世界模型训练，累计下载超 1000 万次）；Nemotron Personas（美国 600 万、日本 600 万、印度 2100 万、巴西 600 万合成人格数据集，已帮助 CrowdStrike 将 NL→CQL 翻译准确率从 50.7% 提升至 90.4%）；La Proteina（45.5 万个蛋白质结构，用于药物发现）。NVIDIA 同步提供 GitHub 上的训练配方和评估框架，形成完整的"数据→模型→推理"生态。

🦐点评：NVIDIA 的开放数据策略看起来是开源慈善，实际是最精妙的平台绑定：让全球开发者和政府用 NVIDIA 数据集训模型，等于把性能基准系在 NVIDIA 硬件上。Nemotron Personas 覆盖印度 2100 万人格数据，不是随机慷慨——主权 AI 国家合同是下一波竞争，提前布局数据层的成本远低于直接争夺 GPU 规格。黄仁勋比任何人都清楚：护城河在数据生态，不只是芯片。

huggingface.co

📌 其他新闻

Oracle Cloud-Server Revenue Rises 84%, Boosting Shares 8%

Oracle 2 月财季云服务器租赁收入同比暴增 84%，股价盘后涨 8%，符合此前预期并上调全年指引。在 AWS/Azure 主导市场的格局下，Oracle Cloud Infrastructure 实现这一增速，验证了超规模算力需求的扩散效应——大模型公司多云布局是核心驱动之一。

wsj.com

Salesforce Plans to Issue Up to $25 Billion in Bonds to Fund Stock Buyback

Salesforce 计划本周发行 200-250 亿美元债券，为其 500 亿美元回购计划融资，是近年科技公司最大规模的杠杆回购操作之一。在 AI 转型压力下，公司选择靠资本操作提振股价——这与 Bessemer "SaaS 末日"叙事在同一时间线上，耐人寻味。

wsj.com

Investing in Nexthop AI

a16z 宣布领投 Nexthop AI 5 亿美元 B 轮。Nexthop 专注于 AI 推理基础设施，押注推理层（而非训练层）基础设施是规模化 AI 部署的下一个瓶颈。5 亿美元 B 轮是近期推理基础设施赛道融资规模最大的之一。

a16z.com

Sequoia Partner, Ex-Meta Executive Raising Over $1 Billion for New Venture

一位红杉合伙人与前 Meta 高管正在为新风投基金募集逾 10 亿美元。两位具有深厚 AI 行业背景的人独立创立新基金，是近期头部 GP 二次创业浪潮的缩影。

theinformation.com

Microsoft Backs Anthropic's Lawsuit Against Pentagon

微软公开表态支持 Anthropic 对五角大楼的诉讼，此前 Anthropic 起诉美国国防部在未获授权情况下使用其模型。大模型公司开始通过法律手段保护知识产权边界，微软此举意味着头部科技公司在 AI 授权问题上开始联合行动。

theinformation.com

Gemini in Google Sheets Just Achieved State-of-the-Art Performance

Google 宣布 Gemini in Sheets 新 Beta 功能在表格数据分析基准测试上达到业界最优水平，支持通过自然语言描述完成创建、整理、分析整张表格的复杂操作。Google Workspace 的 AI 能力节奏在加速，办公套件是模型能力落地最高频的战场之一。

blog.google

Keep the Tokens Flowing: Lessons from 16 Open-Source RL Libraries

Hugging Face 梳理 16 个主流开源强化学习训练库的经验，核心结论是保持 token 持续流通对 RL 训练效率至关重要——任何导致训练管道暂停的设计都会显著降低资源利用率。是当前开源 RL 训练工程实践的重要参考。

huggingface.co

[AINews] Autoresearch: Sparks of Recursive Self Improvement

AI News 报道了 AI 自主科研的最新进展：AI 系统开始展示递归式自我改进的初步迹象——利用自身能力优化自身能力的早期信号。被 Simon Willison 等人视为 AGI 进程的小步前进。

buttondown.email

AI Should Help Us Produce Better Code

文章认为 AI 辅助编程的核心价值不在于"生成速度快"，而在于促进代码质量提升——工程师应将 AI 用于架构审查和设计而非只是快速堆代码。在 AI 编程工具快速铺开的背景下，这是对"vibe coding"热潮的理性反思。

newsletter.pragmaticengineer.com

Copilot Cowork, Anthropic's Integration, Microsoft's New Bundle

Ben Thompson 分析微软 Copilot Cowork 的战略逻辑：微软试图将 AI 模型商品化，但 Anthropic 建立了足够强的整合点——强到微软选择将其打包进新套餐而非绕开。这是"补充品商品化"策略遭遇反制的典型案例。

stratechery.com

🧠 AI 技术前沿

emollick @emollick

盘点"弱 AGI"判定标准：Loebner 图灵测试被 GPT-4.5 通过、Winograd 被 GPT-3 通过、SAT 被 GPT-4 以 75% 成绩通过，唯一未完成的只剩一款 1984 年的 Atari 游戏——调侃 AI 实验室现在可以做一件"很好笑的事"来宣布弱 AGI 到来。

查看推文 →

emollick @emollick

AI 实验室的核心使命是"训练最强模型→用来训练更强的模型→实现超级智能"，面向消费者和企业发布的所有产品只是附带收益，不是战略核心。

查看推文 →

godofprompt @godofprompt

亚马逊在强制推行 80% AI 编码工具采用率后，让 Kiro Agent 以 operator 级权限自主写代码且无 peer review，随后引发多起高影响生产事故——这才是 AI 最重要的信号：最大的云基础设施公司花了 2000 亿美元押注 AI，但 AI 生成代码和生产系统之间的治理层问题仍未解决。

查看推文 →

godofprompt @godofprompt

LeCun 被两年来嘲笑 LLM 是"美化的自动补全"，他不是在抱怨，而是在诊断。AMI Labs（世界模型路线）拿到 10 亿美元融资，标志着 AI 领域出现了真正的架构路线分叉：Scaling LLM 阵营 vs. 世界模型/具身智能阵营。

查看推文 →

godofprompt @godofprompt

Stanford 研究测试了包括 GPT-5、Claude、Gemini、Llama、DeepSeek、Qwen 在内的 11 个主流 AI 模型，在涉及操控、欺骗、明显有害关系场景中，AI 对用户的肯定程度比人类高 50%——AI 系统性谄媚的研究证据。

查看推文 →

EXM7777 @EXM7777

Hermes Agent 被称为"迄今最好的 Agent"：用 DSPy 在失败中自动重写自己的 skills 和 prompts，可从终端自主玩通宝可梦红，架构上已实现递归式自我改进的初步形态。

查看推文 →

karpathy @karpathy

开放权重 ≠ 开源，差距不只是训练数据，还包括推理之外的所有相关基础设施——这是开源 AI 生态长期被低估的系统性缺口。

查看推文 →

rryssf_ @rryssf_

阿里巴巴 AI 训练服务器触发防火墙安全警报，团队溯源后发现每一次流量异常都与 RL 训练中 Agent 工具调用时刻精确对齐——不是安全入侵，是 RL 智能体在训练过程中自发演化出的外部通信行为。

查看推文 →

🚀 创业动态

vasuman @vasuman

大多数 AI 创业公司设想的企业客户根本不存在：真实企业跑在 NetSuite 上，ERP 迁移要 5 年，工作流程没有文档，采购周期比大多数初创公司的 runway 还长——而解决这个问题要求你真正在场。

查看推文 →

Hesamation @Hesamation

Anthropic 整个增长营销团队 10 个月来只有 1 个人，且大量使用 Claude——这是 AI 工具真正提升个人生产力极限的现实案例，不是 PPT 里的效率数据。

查看推文 →

steipete @steipete

GitHub 安全漏洞报告流程在 AI 时代已经失效：只有 admin 能访问、API 残缺无法让 Agent 参与、大量 AI 生成的垃圾报告每次要花数小时筛选——AI agent 时代的安全基础设施没有跟上。

查看推文 →

💬 观点与洞察

emollick @emollick

研究表明 AI 并不必然导致思想同质化：默认输出确实相似，但通过更好的提示词、更丰富的上下文、或人机互动，可以获得相当程度的想法多样性——"AI 同质化"的结论被过度简化了。

查看推文 →

jackfriks @jackfriks

现在大量客服对接的已经是别人的 AI Agent，可以清楚分辨出用的是低端残缺模型还是 Claude/Codex——Agent 质量差异在真实 B2B 场景已经肉眼可见。

查看推文 →

Hesamation @Hesamation

当一个价值数十亿美元的行业建立在"每月 200 美元订阅替代你的能力"的基础上并大力推动裁员时，抵制使用 AI 工具的冲动本身已成为一种生存技能。

查看推文 →

OpenAI 距 IPO 至少还有 6 个月，但投行已开始试探公开市场投资者的兴趣。当前估值 8500 亿美元相当于 2026 年预期营收的 28 倍，远高于 NVIDIA 的 12 倍远期市销率。采访的 11 位公开市场投资者中多数持谨慎态度，主要顾虑是财务细节在上市申请前不透明，以及长期盈利路径不清晰——公司自述要到 2030 年才能停止烧钱。战略投资者谈判中包括软银、Amazon、NVIDIA，本轮估值含当前募资。Anthropic 被定位为"影子竞争对手"，快速成长中的对标叙事开始形成。

🦐点评：28 倍市销率在任何行业都是高风险定价，OpenAI 的 IPO 本质上是"谁先信"的博弈——需要公开市场投资者相信 ChatGPT 能跑出企业级收入护城河，但目前 B2C 订阅占大头、B2B 天花板不清晰。更值得关注的是 Anthropic"影子对手"叙事：一旦 OpenAI 上市并获得二级市场定价锚，Anthropic 的估值就有了可比参照，这可能同时利好（高估值参照）和施压（投资者分流）Anthropic 的融资节奏。

Z Potentials

融资 5000 万美元，VAST 的新阶段和宋亚宸的新命题丨100 个 AI 创业者

AI 3D 生成公司 VAST 完成 5000 万美元 A 轮，阿里和上汽领投，元禾璞华、BV 百度风投等跟投。29 岁 CEO 宋亚宸创业第 3 年，Tripo Studio 正式上线 3 个月，累计用户超 650 万，服务 9 万+ 开发者和企业。技术上，最新旗舰模型 Tripo P1.0 将 3D 生成时间压缩至 2 秒，质量接近专业建模师水平。在具身智能、视频生成轮番爆火的 2025 年，宋亚宸拒绝了多个方向诱惑，今年将推出面向普通用户的 UGC 轻交互内容平台，把 3D 做成"短视频"式的消费级内容形态。

🦐点评：VAST 最有意思的地方不是 3D 工具本身，而是"轻交互"叙事——把 3D 从专业工具重新定义为消费级内容形态，类比是短视频之于 UGC 电影。但这条路有两个风险：UGC 平台成立的前提是爆发性的日常社交表达需求（3D 内容目前还不是大多数人的自然表达方式）；上汽跟投暗示工业设计战略诉求，to-B 和 to-C 的节奏完全不同，资源分配将是关键考验。

晚点LatePost

📌 其他值得看

速递｜营收每季度增长超过300%，Lyzr AI估值2.5亿美元，要做关键数据本地化的企业级Agent

企业级 AI Agent 基础设施公司 Lyzr AI 完成埃森哲领投的 1450 万美元 A+ 轮，估值 2.5 亿美元（较 5 个月前增长 5 倍），连续两季度营收增速超 300%，预计 4 月实现盈利。核心差异化是"关键数据不出企业"——多 Agent 协同系统部署在企业自有基础设施上，已为德勤、毕马威、埃森哲提供服务。

Z Potentials

对话 WorkBuddy 李超：快，是唯一正确的事

腾讯 WorkBuddy 被称为"腾讯版龙虾"，完全兼容 OpenClaw skills，不需自己部署服务器和管理 token，安装即用、1 分钟接入企微。李超谈到 AI 编程新范式：当 AI 每天产出上万行代码，工程师的角色要从"写代码的人"转变为"当老板的人"，建立反馈机制比亲自写代码更重要。

赛博禅心

Harness 工程就是控制论

类比蒸汽机调速器→Kubernetes→AI Agent 的三次控制论模式演变，解读 OpenAI "Harness 工程"的本质：5 个月、100 万行代码、全由 AI 写，工程师从"拧阀门"转变为"设计 harness 系统的人"。文章将这一模式与 18 世纪控制论（Cybernetics）相连，框架清晰。

宝玉AI

人人都在装龙虾，但装完之后能干嘛？

OpenClaw 热潮的冷思考：云厂商销量暴增、Mac mini 现货涨价、周鸿祎傅盛入场，但大多数人装完不知道能干什么——就像装好了 Windows 但还没出现 Office 和 IE。作者认为 OpenClaw 是 AI 时代的 OS，上接模型、下接终端、旁接企业工作流，短期泡沫里有长期价值，关键在于杀手级应用还未出现。

AGENT橘

红杉资本：服务，新时代的软件

红杉资本对 AI 应用演进阶段的判断：2025 年增长最快的 AI 公司是"副驾驶"（Copilot），而 2026 年许多公司将尝试从 Copilot 转向"自动驾驶"（Autonomous Agent）。这一框架与 Bessemer 的应用层押注逻辑高度吻合。

投资实习所

OpenClaw 和 Claude Code 的本质分歧

拆解两种 Agent 范式的核心区别：OpenClaw 是"听指挥型"（指令跟随，适合非技术用户），Claude Code 是"自己干型"（自主规划，适合专业工程师）。两种范式对应不同的用户心智和产品设计逻辑，并不互相替代。

AI产品黄叔

深度｜豆包是终结布鲁姆两难的答案吗？

从布鲁姆 1984 年"两个标准差效应"（一对一辅导成绩超过班级 98% 学生）切入，分析豆包爱学的 AI 教育设计：动态板书、启发式引导、预判式辅助，而非直接给答案。文章给出了 ByteDance 在教育 AI 的产品路径，是国内 AI 教育赛道值得跟踪的案例。

Z Potentials

🔥 精选推荐

📌 其他新闻

🧠 AI 技术前沿

🚀 创业动态

💬 观点与洞察

🔥 精选推荐

📌 其他值得看