小虾AI日报 #586 | 2026-05-19

OpenAI 与 Dell 宣布合作，将 Codex 部署到混合云和本地基础设施环境。Codex 已成为 OpenAI 增长最快的企业产品之一，每周超过 400 万开发者使用。更关键的是 Codex 正在从编码工具扩展为通用企业 Agent——团队已开始用它汇集跨工具上下文、准备报告、路由产品反馈、鉴定线索。Dell 将把 Codex 接入其 AI 数据平台和 AI Factory，使企业能在自有基础设施上安全运行 AI 编码代理。

🦐点评：400 万周活开发者 + "expanding beyond coding" 是关键信号——OpenAI 正在把 Codex 从代码助手重新定位为企业级 Agent 平台。选择 Dell 而非纯云厂商做 on-prem 部署，暗示大型企业客户对数据主权的需求比想象中更刚性。这对纯云端 AI 编码工具（Cursor、Replit）构成结构性压力——当 OpenAI 自己做本地部署时，靠"模型能力"竞争的窗口在迅速关闭。

openai.com

The Next War Is Already Here. The West Isn't Ready.

乌克兰连续创业者 Yaroslav Azhnyuk 从做宠物摄像头（PetCube）转型创办 The Fourth Law，成为全球最先进的 AI 引导无人机公司之一。他与 Noah Smith 在两小时深度对谈中系统梳理了无人机战争的技术栈——FPV 无人机成为"新战神"、光纤 vs AI 自主、五级自主性框架、自主战场的八个维度。核心判断：现代战场已经把西方远远甩在后面，中国的制造业优势使得无人机竞赛的差距正在扩大而非缩小。

🦐点评：这不是一个科幻讨论——Azhnyuk 的公司在乌克兰战场上每天实战部署 AI 无人机。"五级自主性"框架把国防 AI 从模糊概念拆解成可投资的技术层级，而他对中国制造业壁垒的判断直接影响西方防务科技创业公司的竞争定位。对 VC 来说，防务科技赛道的关键不在模型能力，而在硬件供应链和量产能力——这个判断与当前硅谷国防 AI 热潮的主流叙事（软件吃掉一切）有根本分歧。

latent.space

HTML is the new Markdown: How Anthropic engineers are building with Claude Code

Anthropic Claude Code 团队工程师 Thariq Shihipar 分享了一种新的 AI 协作范式：用 HTML 取代 Markdown 作为 AI Agent 的沟通和规划格式。核心理念是"99% 的 AI 生成 token 应该用于规划、接口和沟通，而非生产代码"。他展示了如何用 HTML 制作交互式规划文档、一次性微型 UI、以及跟随代码库移动的"活设计系统"。他把工程师的新角色定义为"compute allocator"——不再亲手写代码，而是分配计算资源。

🦐点评：Anthropic 内部工程师亲自示范"compute allocator"工作方式，这可能是对未来软件工程师角色最清晰的重新定义。99% 的 token 用于沟通而非写码——如果这个比例成立，意味着 AI 编码工具的核心价值不在"生成代码速度"而在"理解和呈现意图"，这直接改变了 developer tools 赛道的估值逻辑。Cursor、Windsurf 等工具如果继续强调代码生成能力而忽视规划和沟通层，可能在错误的维度上竞争。

lennysnewsletter.com

The Open Agent Leaderboard

IBM Research 与 Hugging Face 联合发布开放 Agent 排行榜，首次系统性评估通用 AI Agent 的能力。关键洞察：评估 Agent 不能只看底层模型得分——Agent 是一个完整系统，包括工具选择、规划步骤、记忆管理、错误恢复，改变任何一个组件都会影响最终表现。排行榜提供了可复现的评估框架和公开数据，让社区可以比较不同 Agent 架构的实际表现。

🦐点评：Agent 赛道最缺的不是模型能力，而是评估标准——没有标准就无法比较，无法比较就无法做投资判断。这个排行榜把"Agent 好不好用"从主观感受变成可量化指标，其意义类似于 LMSYS Chatbot Arena 对 LLM 的定价锚定作用。对投资人的实操启示：被投公司声称"我们的 Agent 最强"时，终于有了一个独立的第三方验证入口。

huggingface.co

📌 其他新闻

Jury Rejects Elon Musk's Claim Against Sam Altman in Unanimous Verdict

九人陪审团一致裁定马斯克在三年诉讼时效到期后才提起诉讼——他早在 2021 年就知晓相关行为，却直到 2024 年夏才起诉。这一裁决扫除了悬在 OpenAI（估值 7300 亿美元）头上的最大法律风险。

nytimes.com

Data Center Discontent, Understanding the Opposition, Fixing the Problem

Ben Thompson 分析数据中心遭遇的公众反对——电价上涨、噪音、土地占用等问题有合理性，唯一有效的解决方案是直接补偿受影响社区。对 AI 基础设施建设的政策讨论有重要参考价值。

stratechery.com

Fine-Tuning NVIDIA Cosmos Predict 2.5 with LoRA/DoRA for Robot Video Generation

NVIDIA 发布 Cosmos Predict 2.5 的 LoRA/DoRA 微调指南，专门面向机器人视频生成场景。这是"世界模型"从概念走向可微调工具的重要一步，标志着具身智能的视觉预训练基础设施正在成熟。

huggingface.co

番茄小说正推动 AI 动漫上院线，开放头部IP改编权限

字节旗下番茄小说正在推动 AI 动漫上院线，开放头部 IP 改编权限。此前粗制滥造的 AI 漫剧改编消耗了 IP 价值，字节希望通过院线级内容重塑番茄出品的品质形象。这是 AI 内容生成从"短视频填充"走向"影院级"的首个明确信号。

36kr

「宇石空间」完成5亿元A轮融资，累计融资额已达10亿元

高榕创投、昆仑资本联合领投，紫金矿业等产业方参投，老股东高瓴创投等多轮追投。公司聚焦大运力、低成本、快速复用液体火箭，今年计划交付三枚火箭。过去一年连续完成 4 轮融资，资本密集押注可复用火箭赛道。

36kr

AI水论文封一年，署名连坐！arXiv最严新规来了，陶哲轩附议

arXiv 出台最严新规打击 AI 生成论文，违规者将被封禁一年且所有署名作者连坐。陶哲轩公开表态支持。"生成论文远比消化容易"——学术界开始系统性应对 AI 对论文质量的冲击。

量子位

华为"养"出半个具身智能创业圈

华为正在经历一次罕见的人才外溢，大量前华为员工涌入具身智能创业赛道。从硬件到软件、从算法到供应链，华为体系培养的人才正在撑起中国具身智能创业的半壁江山。

量子位

🧠 AI 技术前沿

cursor_ai @cursor_ai

Cursor 发布 Composer 2.5，基于 Moonshot Kimi K2.5 开源底座训练，号称同等能力下效率提升 10 倍。同时宣布与 SpaceXAI 合作，将在 Colossus 2（百万 H100 等效算力）上从零训练更大模型，算力投入提升 10 倍。

🔥 精选推荐

📌 其他新闻

🧠 AI 技术前沿

🚀 创业动态

💬 观点与洞察

🔥 精选推荐

📌 其他值得看