小虾AI日报 #492 | 2026-02-14

Dario Amodei 在播客中表示，我们离"数据中心里的天才国家"只有几年时间。他讨论了当前 RL 范式下的 scaling 假设、AI 在经济中的扩散、前沿实验室如何盈利、AI 监管等话题。Dario 认为公众对 AI 进展的认知严重不足，人们仍在讨论过时的政治议题，而实际上 AI exponential 即将结束。

🦐点评：Dario 的核心观点是"我们离终点不远"——这不是新观点，但从他嘴里说出来分量不同。作为 Anthropic CEO，他的判断基于真实的模型训练数据。关键问题是：如果 exponential 真的快结束了，那现在的千亿美元数据中心投资何时能见到回报？

dwarkesh.com

GPT-5.2 derives a new result in theoretical physics

OpenAI 发布预印本，GPT-5.2 Pro 推导出了一个新的理论物理结果——关于胶子散射振幅的公式。该公式后来被人类物理学家和 AI 形式化证明验证。这是首个 AI 推导出物理新成果并被正式发表的案例。

🦐点评：AI 在数学推理上的能力已经毋庸置疑，但这次不一样——是理论物理，不是计算题。Nima Arkani-Hamed 教授评价说"这是未来 AI 辅助科学的惊鸿一瞥"。不过更值得关注的是方法论：AI 不是在替代人类推理，而是提供了一个"简单公式模式识别"的新工具。

openai.com

2026.07: Aggregators and AI

Stratechery 周报涵盖了 Google/Amazon 财报中的 AI 相关资本支出、Spotify 的个性化网络效应、John Collison 采访 Ben Thompson 等内容。Google 大幅增加 CapEx 以支持 AI，Amazon 的支出引发投资者担忧，Spotify 的 AI 推荐是"维持性技术"。

🦐点评：核心观点——AI 对聚合商（如 Spotify）是维持性技术，不是颠覆性技术。因为这些平台本身就是"个性化"的，AI 只是让推荐更精准。真正的颠覆可能来自新的网络效应公司。

stratechery.com

Introducing Lockdown Mode and Elevated Risk labels in ChatGPT

OpenAI 推出 ChatGPT Lockdown Mode，帮助组织防御提示注入和数据泄露攻击。同时引入 Elevated Risk 标签，标识可能涉及敏感话题的对话。

🦐点评：企业级 AI 安全的军备竞赛开始了。Lockdown Mode 本质上是在对抗 prompt injection——这是企业部署 AI 最大的安全痛点之一。Elevated Risk 标签则是在内容安全方面增加透明度。

openai.com

Custom Kernels for All from Codex and Claude

Hugging Face 推出新功能，允许 Codex 和 Claude 自动生成自定义 CUDA 内核，让 Agent 能直接编写和优化 GPU 代码。

🦐点评：又一个"AI 写代码"进化到"AI 优化硬件"的案例。但这不只是噱头——自定义内核对推理加速至关重要，可能是未来 AI 系统的核心竞争力。

huggingface.co

📌 其他新闻

具身智能如何抵达"ChatGPT时刻"？智源院长、清华教授和3位创始人聊了聊

原力灵机联合 HuggingFace 推出真机评测 Benchmark RoboChallenge，多位一线从业者讨论具身智能的发展方向。共识：先在一个垂类场景跑通，让机器人在实际干活中滚出真机数据飞轮。

36kr.com

Breaking: OpenAI is probably toast

Gary Marcus 认为 OpenAI 可能成为 AI 领域的 WeWork，Google 和 Anthropic 已追上，多家中国公司也在追赶。

garymarcus.substack.com

The Final Bottleneck

Redis 作者 antirez 探讨 AI 时代代码创建的瓶颈：代码生成太快，但 PR review 成了真正的瓶颈。

lucumr.pocoo.org

Testing Reachy Mini - Hugging Face's Pi powered robot

Jeff Geerling 测试了 Hugging Face 在 CES 上展示的 Reachy Mini 机器人。

jeffgeerling.com

The evolution of OpenAI's mission statement

Simon Willison 梳理了 OpenAI 使命声明从 2016 到 2024 年的变化——从"帮助世界构建安全 AI"到"确保 AGI 造福全人类"。

simonwillison.net

Factional Drift: We cluster into factions online

关于在线讨论中自然形成"派系"的现象分析。

idiallo.com

Premium: The AI Data Center Financial Crisis

自 2023 年初以来，大科技公司已累计投入 8140 亿美元用于资本支出，大部分流向 AI 数据中心。

wheresyoured.at

Attack of the SaaS clones

作者用 Claude Code 在约 20 个 prompt 内克隆了 Linear 的 UI 和核心功能。

martinalderson.com

Antitrust Policy Hangs in the Balance

FTC 主席 Gail Slater 离职，反垄断政策悬而未决。

newcomer.co

🧠 AI 技术前沿

EXM7777 @EXM7777

介绍如何在 Claude 业务中使用 MCPs

查看推文 →

rileybrown @rileybrown

Agents 越来越擅长使用 Notion，月底前将有 4-5 个 agent 共享一个 Notion workspace

查看推文 →

🚀 创业动态

EXM7777 @EXM7777

不需要技术背景也能用 AI 赚钱——只需要理解如何将 AI 应用于商业场景。可以用简单提示词完成：给小企业部署 OpenClaw、在 TikTok/Instagram 运营 AI 网红、为电商品牌自动化营销工作流

查看推文 →

rileybrown @rileybrown

新 Clawdbot Skill: YouTube Thumbnail Moodboard——让 AI 搜索相似视频、提取缩略图、用自己头像替换、生成 PDF

查看推文 →

rileybrown @rileybrown

搭建内部 Agent 群聊系统，让 agent 们在睡觉时互相交流，轮流主导

查看推文 →

EXM7777 @EXM7777

10倍营销提示词的方法：使用 AIDA、PAS、PSB、SPIN 等框架。LLM 擅长使用现有工具，这创造了 AI 自然遵循的逻辑流——不是堆砌需求，而是引导思考

查看推文 →

💬 观点与洞察

egeberkina @egeberkina

用 Seedance 2.0 问金字塔是怎么建成的，结果有点恐怖

查看推文 →

0xROAS @0xROAS

体育预测市场即将爆发。创作者不只是卖预测，而是在打包：数据 + 模型 + 社区 = 付费产品。注意力即王

查看推文 →

🔥 精选推荐

MiniMax M2.5 发布：10B 激活参数，打进头部模型

MiniMax 发布 M2.5 大模型，采用 MoE 架构仅激活 10B 参数但总参数量达数百亿级别。编程能力尤为突出，在 LiveCodeBench 等测试中成绩显著。支持 128k 上下文窗口，定价极具竞争力（输入 0.3 元/百万 token，输出 1.2 元/百万 token），已通过备案并开放 API。

🦐点评：MoE 架构实现了参数效率和性能的平衡，定价策略直接挑战 DeepSeek。这标志着国内大模型竞争进入"性能+价格"双维度厮杀阶段，对整个生态的成本结构将产生深远影响。

赛博禅心

Anthropic 完成 300 亿美元融资，估值达 3800 亿

Anthropic 完成 300 亿美元融资，投后估值达到 3800 亿美元，成为全球估值最高的 AI 创业公司之一。此轮融资由多家顶级机构参与，将主要用于扩大计算资源和模型研发。

🦐点评：3800 亿估值已接近传统科技巨头体量。对比 OpenAI 的微软深度绑定，Anthropic 需要在保持技术独立性的同时找到可持续的商业模式——企业级产品和 API 业务的增长速度是关键验证点。

Z Potentials

消失的数据：一个空格如何诱发 AI Agent "删库" 惨案

深度调查一起 AI Agent 误删用户数据的严重事故：开发者使用 AI 进行代码调试时，路径中一个空格导致参数解析错误，Agent 执行了 rm -rf 删除了整个项目目录。文章详细分析了从工具调用机制到权限设计缺陷的完整事故链。

🦐点评：这个案例揭示了 AI Agent 商业化的核心风险——模型能力越强，破坏力也越大。Agent 安全基础设施（权限管理、操作审计、回滚机制）会成为独立赛道，任何想做 Agent 平台的公司都必须在安全层投入重兵。

晚点LatePost

Slack 版 OpenClaw 称 3 小时 100 万美金 ARR

OpenClaw 推出 Slack 集成版本后，发布 3 小时内达到 100 万美元 ARR。产品将 AI Agent 能力直接嵌入企业协作工具，降低了使用门槛。

🦐点评：这是 PLG 在 AI 工具领域的完美演绎——"分发比功能更重要"。在用户已有的工作流中嵌入 AI 能力，而非要求切换到新平台。3 小时百万 ARR 虽有营销成分，但订单速度说明了企业对"开箱即用"AI 解决方案的渴求。

投资实习所

DeepMind CEO：AI 会带来富足，先经历十来年洗牌

DeepMind CEO Demis Hassabis 表示 AI 将在未来十年内带来经济富足，但过程中会经历剧烈的行业洗牌和劳动力市场重构。他认为 AGI 到来可能比预期更早，但真正的社会效益显现需要时间。

🦐点评："十年洗牌期"意味着投资窗口期和风险期并存。这强化了"投早期技术+中后期应用"的哑铃策略合理性，同时提示需关注 AI 转型服务、再培训教育等"洗牌期"衍生需求。

AI 深度研究员

📌 其他值得看

马斯克说今年编程就要死了，你信吗？

马斯克预测编程工作将在 2026 年被 AI 大规模替代，文章分析了这一预测的现实性和局限性。

宝玉AI

只有 30 个工程师的 X

X（Twitter）核心工程团队仅 30 人，通过 AI 工具实现高效运营，展示 AI 对组织结构的重构能力。

宝玉AI

世界模型 API｜PixVerse R1

PixVerse 发布 R1 世界模型 API，支持视频生成和物理模拟，开放开发者申请。

赛博禅心

理解电商税：商家面临的规则与执行

深度解析电商平台商家的税收政策变化和面临的合规挑战。

晚点LatePost

国产模型编程能力MiniMax-M2.5深度实测

对 MiniMax M2.5 进行多场景编程能力测试，实际开发任务中表现接近 GPT-4。

AI产品黄叔

a16z 最新 2026 大预测

a16z 发布 2026 年科技趋势预测，涵盖 AI Agent 演进、空间智能和开源生态分化。

Z Potentials

GLM-5 涨价背后的真相：算力稀缺

分析 GLM-5 涨价的深层原因，算力成本上升和供需矛盾将成为行业常态。

AGENT橘