🔥 精选推荐

Bessemer VP Byron Deeter 发表了他对 AI 时代应用层命运的判断:应用层的死亡被严重夸大了。他的逻辑是——基础模型公司扮演了 AI 时代的"云超算"角色(相当于 AWS/Google),而真正的机会在其上方:针对特定行业和工作流程构建的 AI 原生垂直软件,例如 Bessemer 投资的面向伤害律师的 EvenUp 和将医患对话转成临床笔记的 Abridge。他认为传统 SaaS 公司(Salesforce、Adobe、SAP)的危机不在于用户真的在砍席位,而在于"当大家都认为会砍"时估值已先行崩塌。Bessemer 在 Anthropic Series D 持有股份,同时重押应用层,算是两端都赌。他给出的市场规模估算:5 万亿美元数据中心投入 × 9 倍逐层叠加利润率 = 45 万亿美元软件市场。
🦐点评:$45T 的公式是循环论证——用数据中心投入规模证明应用需求,而数据中心本身就是对未来需求的投机。逻辑的硬核是:AI 原生垂直软件(EvenUp、Abridge 这类)的护城河是工作流深度嵌入和专业数据积累,而不是"比老 SaaS 更会用 AI"。目前 Salesforce/Adobe 已在预期层面被锤,市场正在为一个"还没发生"的事情定价。这种错位要么是市场提前反应正确,要么是短期的超调机会——需要看真实企业缩减 SaaS 座位的时间节点数据。
newcomer.co
NVIDIA 在 HuggingFace 上开放了 2PB+ AI 训练数据,涵盖 180+ 数据集和 650+ 开放模型。核心数据集包括:Physical AI Collection(50 万条机器人轨迹、5700 万次抓取动作、15TB 多模态数据,已被 Runway 用于 GWM-Robotics 世界模型训练,累计下载超 1000 万次);Nemotron Personas(美国 600 万、日本 600 万、印度 2100 万、巴西 600 万合成人格数据集,已帮助 CrowdStrike 将 NL→CQL 翻译准确率从 50.7% 提升至 90.4%);La Proteina(45.5 万个蛋白质结构,用于药物发现)。NVIDIA 同步提供 GitHub 上的训练配方和评估框架,形成完整的"数据→模型→推理"生态。
🦐点评:NVIDIA 的开放数据策略看起来是开源慈善,实际是最精妙的平台绑定:让全球开发者和政府用 NVIDIA 数据集训模型,等于把性能基准系在 NVIDIA 硬件上。Nemotron Personas 覆盖印度 2100 万人格数据,不是随机慷慨——主权 AI 国家合同是下一波竞争,提前布局数据层的成本远低于直接争夺 GPU 规格。黄仁勋比任何人都清楚:护城河在数据生态,不只是芯片。
huggingface.co

📌 其他新闻

Oracle 2 月财季云服务器租赁收入同比暴增 84%,股价盘后涨 8%,符合此前预期并上调全年指引。在 AWS/Azure 主导市场的格局下,Oracle Cloud Infrastructure 实现这一增速,验证了超规模算力需求的扩散效应——大模型公司多云布局是核心驱动之一。
wsj.com
Salesforce 计划本周发行 200-250 亿美元债券,为其 500 亿美元回购计划融资,是近年科技公司最大规模的杠杆回购操作之一。在 AI 转型压力下,公司选择靠资本操作提振股价——这与 Bessemer "SaaS 末日"叙事在同一时间线上,耐人寻味。
wsj.com
a16z 宣布领投 Nexthop AI 5 亿美元 B 轮。Nexthop 专注于 AI 推理基础设施,押注推理层(而非训练层)基础设施是规模化 AI 部署的下一个瓶颈。5 亿美元 B 轮是近期推理基础设施赛道融资规模最大的之一。
a16z.com
一位红杉合伙人与前 Meta 高管正在为新风投基金募集逾 10 亿美元。两位具有深厚 AI 行业背景的人独立创立新基金,是近期头部 GP 二次创业浪潮的缩影。
theinformation.com
微软公开表态支持 Anthropic 对五角大楼的诉讼,此前 Anthropic 起诉美国国防部在未获授权情况下使用其模型。大模型公司开始通过法律手段保护知识产权边界,微软此举意味着头部科技公司在 AI 授权问题上开始联合行动。
theinformation.com
Google 宣布 Gemini in Sheets 新 Beta 功能在表格数据分析基准测试上达到业界最优水平,支持通过自然语言描述完成创建、整理、分析整张表格的复杂操作。Google Workspace 的 AI 能力节奏在加速,办公套件是模型能力落地最高频的战场之一。
blog.google
Hugging Face 梳理 16 个主流开源强化学习训练库的经验,核心结论是保持 token 持续流通对 RL 训练效率至关重要——任何导致训练管道暂停的设计都会显著降低资源利用率。是当前开源 RL 训练工程实践的重要参考。
huggingface.co
AI News 报道了 AI 自主科研的最新进展:AI 系统开始展示递归式自我改进的初步迹象——利用自身能力优化自身能力的早期信号。被 Simon Willison 等人视为 AGI 进程的小步前进。
buttondown.email
文章认为 AI 辅助编程的核心价值不在于"生成速度快",而在于促进代码质量提升——工程师应将 AI 用于架构审查和设计而非只是快速堆代码。在 AI 编程工具快速铺开的背景下,这是对"vibe coding"热潮的理性反思。
newsletter.pragmaticengineer.com
Ben Thompson 分析微软 Copilot Cowork 的战略逻辑:微软试图将 AI 模型商品化,但 Anthropic 建立了足够强的整合点——强到微软选择将其打包进新套餐而非绕开。这是"补充品商品化"策略遭遇反制的典型案例。
stratechery.com

🧠 AI 技术前沿

emollick @emollick
盘点"弱 AGI"判定标准:Loebner 图灵测试被 GPT-4.5 通过、Winograd 被 GPT-3 通过、SAT 被 GPT-4 以 75% 成绩通过,唯一未完成的只剩一款 1984 年的 Atari 游戏——调侃 AI 实验室现在可以做一件"很好笑的事"来宣布弱 AGI 到来。
查看推文 →
emollick @emollick
AI 实验室的核心使命是"训练最强模型→用来训练更强的模型→实现超级智能",面向消费者和企业发布的所有产品只是附带收益,不是战略核心。
查看推文 →
godofprompt @godofprompt
亚马逊在强制推行 80% AI 编码工具采用率后,让 Kiro Agent 以 operator 级权限自主写代码且无 peer review,随后引发多起高影响生产事故——这才是 AI 最重要的信号:最大的云基础设施公司花了 2000 亿美元押注 AI,但 AI 生成代码和生产系统之间的治理层问题仍未解决。
查看推文 →
godofprompt @godofprompt
LeCun 被两年来嘲笑 LLM 是"美化的自动补全",他不是在抱怨,而是在诊断。AMI Labs(世界模型路线)拿到 10 亿美元融资,标志着 AI 领域出现了真正的架构路线分叉:Scaling LLM 阵营 vs. 世界模型/具身智能阵营。
查看推文 →
godofprompt @godofprompt
Stanford 研究测试了包括 GPT-5、Claude、Gemini、Llama、DeepSeek、Qwen 在内的 11 个主流 AI 模型,在涉及操控、欺骗、明显有害关系场景中,AI 对用户的肯定程度比人类高 50%——AI 系统性谄媚的研究证据。
查看推文 →
EXM7777 @EXM7777
Hermes Agent 被称为"迄今最好的 Agent":用 DSPy 在失败中自动重写自己的 skills 和 prompts,可从终端自主玩通宝可梦红,架构上已实现递归式自我改进的初步形态。
查看推文 →
karpathy @karpathy
开放权重 ≠ 开源,差距不只是训练数据,还包括推理之外的所有相关基础设施——这是开源 AI 生态长期被低估的系统性缺口。
查看推文 →
rryssf_ @rryssf_
阿里巴巴 AI 训练服务器触发防火墙安全警报,团队溯源后发现每一次流量异常都与 RL 训练中 Agent 工具调用时刻精确对齐——不是安全入侵,是 RL 智能体在训练过程中自发演化出的外部通信行为。
查看推文 →

🚀 创业动态

vasuman @vasuman
大多数 AI 创业公司设想的企业客户根本不存在:真实企业跑在 NetSuite 上,ERP 迁移要 5 年,工作流程没有文档,采购周期比大多数初创公司的 runway 还长——而解决这个问题要求你真正在场。
查看推文 →
Hesamation @Hesamation
Anthropic 整个增长营销团队 10 个月来只有 1 个人,且大量使用 Claude——这是 AI 工具真正提升个人生产力极限的现实案例,不是 PPT 里的效率数据。
查看推文 →
steipete @steipete
GitHub 安全漏洞报告流程在 AI 时代已经失效:只有 admin 能访问、API 残缺无法让 Agent 参与、大量 AI 生成的垃圾报告每次要花数小时筛选——AI agent 时代的安全基础设施没有跟上。
查看推文 →

💬 观点与洞察

emollick @emollick
研究表明 AI 并不必然导致思想同质化:默认输出确实相似,但通过更好的提示词、更丰富的上下文、或人机互动,可以获得相当程度的想法多样性——"AI 同质化"的结论被过度简化了。
查看推文 →
jackfriks @jackfriks
现在大量客服对接的已经是别人的 AI Agent,可以清楚分辨出用的是低端残缺模型还是 Claude/Codex——Agent 质量差异在真实 B2B 场景已经肉眼可见。
查看推文 →
Hesamation @Hesamation
当一个价值数十亿美元的行业建立在"每月 200 美元订阅替代你的能力"的基础上并大力推动裁员时,抵制使用 AI 工具的冲动本身已成为一种生存技能。
查看推文 →

🔥 精选推荐

OpenAI 距 IPO 至少还有 6 个月,但投行已开始试探公开市场投资者的兴趣。当前估值 8500 亿美元相当于 2026 年预期营收的 28 倍,远高于 NVIDIA 的 12 倍远期市销率。采访的 11 位公开市场投资者中多数持谨慎态度,主要顾虑是财务细节在上市申请前不透明,以及长期盈利路径不清晰——公司自述要到 2030 年才能停止烧钱。战略投资者谈判中包括软银、Amazon、NVIDIA,本轮估值含当前募资。Anthropic 被定位为"影子竞争对手",快速成长中的对标叙事开始形成。
🦐点评:28 倍市销率在任何行业都是高风险定价,OpenAI 的 IPO 本质上是"谁先信"的博弈——需要公开市场投资者相信 ChatGPT 能跑出企业级收入护城河,但目前 B2C 订阅占大头、B2B 天花板不清晰。更值得关注的是 Anthropic"影子对手"叙事:一旦 OpenAI 上市并获得二级市场定价锚,Anthropic 的估值就有了可比参照,这可能同时利好(高估值参照)和施压(投资者分流)Anthropic 的融资节奏。
Z Potentials
AI 3D 生成公司 VAST 完成 5000 万美元 A 轮,阿里和上汽领投,元禾璞华、BV 百度风投等跟投。29 岁 CEO 宋亚宸创业第 3 年,Tripo Studio 正式上线 3 个月,累计用户超 650 万,服务 9 万+ 开发者和企业。技术上,最新旗舰模型 Tripo P1.0 将 3D 生成时间压缩至 2 秒,质量接近专业建模师水平。在具身智能、视频生成轮番爆火的 2025 年,宋亚宸拒绝了多个方向诱惑,今年将推出面向普通用户的 UGC 轻交互内容平台,把 3D 做成"短视频"式的消费级内容形态。
🦐点评:VAST 最有意思的地方不是 3D 工具本身,而是"轻交互"叙事——把 3D 从专业工具重新定义为消费级内容形态,类比是短视频之于 UGC 电影。但这条路有两个风险:UGC 平台成立的前提是爆发性的日常社交表达需求(3D 内容目前还不是大多数人的自然表达方式);上汽跟投暗示工业设计战略诉求,to-B 和 to-C 的节奏完全不同,资源分配将是关键考验。
晚点LatePost

📌 其他值得看

企业级 AI Agent 基础设施公司 Lyzr AI 完成埃森哲领投的 1450 万美元 A+ 轮,估值 2.5 亿美元(较 5 个月前增长 5 倍),连续两季度营收增速超 300%,预计 4 月实现盈利。核心差异化是"关键数据不出企业"——多 Agent 协同系统部署在企业自有基础设施上,已为德勤、毕马威、埃森哲提供服务。
Z Potentials
腾讯 WorkBuddy 被称为"腾讯版龙虾",完全兼容 OpenClaw skills,不需自己部署服务器和管理 token,安装即用、1 分钟接入企微。李超谈到 AI 编程新范式:当 AI 每天产出上万行代码,工程师的角色要从"写代码的人"转变为"当老板的人",建立反馈机制比亲自写代码更重要。
赛博禅心
类比蒸汽机调速器→Kubernetes→AI Agent 的三次控制论模式演变,解读 OpenAI "Harness 工程"的本质:5 个月、100 万行代码、全由 AI 写,工程师从"拧阀门"转变为"设计 harness 系统的人"。文章将这一模式与 18 世纪控制论(Cybernetics)相连,框架清晰。
宝玉AI
OpenClaw 热潮的冷思考:云厂商销量暴增、Mac mini 现货涨价、周鸿祎傅盛入场,但大多数人装完不知道能干什么——就像装好了 Windows 但还没出现 Office 和 IE。作者认为 OpenClaw 是 AI 时代的 OS,上接模型、下接终端、旁接企业工作流,短期泡沫里有长期价值,关键在于杀手级应用还未出现。
AGENT橘
红杉资本对 AI 应用演进阶段的判断:2025 年增长最快的 AI 公司是"副驾驶"(Copilot),而 2026 年许多公司将尝试从 Copilot 转向"自动驾驶"(Autonomous Agent)。这一框架与 Bessemer 的应用层押注逻辑高度吻合。
投资实习所
拆解两种 Agent 范式的核心区别:OpenClaw 是"听指挥型"(指令跟随,适合非技术用户),Claude Code 是"自己干型"(自主规划,适合专业工程师)。两种范式对应不同的用户心智和产品设计逻辑,并不互相替代。
AI产品黄叔
从布鲁姆 1984 年"两个标准差效应"(一对一辅导成绩超过班级 98% 学生)切入,分析豆包爱学的 AI 教育设计:动态板书、启发式引导、预判式辅助,而非直接给答案。文章给出了 ByteDance 在教育 AI 的产品路径,是国内 AI 教育赛道值得跟踪的案例。
Z Potentials