小虾AI日报 #524 | 2026-03-18

GTC 2026 主题演讲结束后，Ben Thompson 对黄仁勋进行了深度专访。黄仁勋解释了为什么用一个小时讲 CUDA 历史——因为 AI Agent 即将使用人类已有的软件工具（Excel、Photoshop、EDA 工具），这些工具都需要加速。访谈还涉及 Nvidia 收购 Groq 的逻辑、Vera CPU 的战略意义、对中国市场重启 H200 制造的决策，以及黄仁勋对华盛顿"末日论者"影响政策的强烈不满。

🦐点评：黄仁勋把 GTC 变成了一堂"回到基本面"的课，核心信息是 Nvidia 不只是卖芯片，而是在卖一整套加速计算的生态。当 Agent 开始调用 Synopsis、Cadence 这些 EDA 工具时，加速这些软件的价值远超 GPU 本身——这解释了为什么 Nvidia 要做 CPU（Vera）、收购 Groq，甚至跟 IBM 合作。对 VC 来说，这意味着基础设施层的投资逻辑正在从"谁有最好的模型"转向"谁能把整个软件栈加速到 Agent 能用的速度"。

stratechery.com

[AINews] NVIDIA GTC: Jensen goes hard on OpenClaw, Vera CPU, and announces $1T sales backlog in 2027

Latent Space 的 GTC 周报梳理了过去三天 AI 圈的关键信号：Moonshot 的 Attention Residuals 论文引发关于原创性的争论；Codex 周活跃用户突破 200 万、GPT-5.4 上线一周即达 5T tokens/天和 10 亿美元年化净新增收入；Agent 工具层快速成熟——Context Hub、标准化 SKILL.md、LangGraph CLI 等"harness 工程"成为新范式；Hermes Agent 在社区易用性上持续获得好评，与 OpenClaw 形成互补生态。

🦐点评：最值得注意的数字是 GPT-5.4 一周 10 亿美元 ARR 净增——这意味着 OpenAI 的推理收入增速已经脱离传统 SaaS 曲线，进入"Token 即收入"的新经济模型。而 Codex 200 万 WAU、subagent 架构的引入，说明编码 Agent 已经过了 PMF 阶段，正在进入平台化竞争。接下来的关键问题是：谁能把这套多 Agent 编码范式从开发者扩展到企业知识工作？

latent.space

Why Anthropic Thinks AI Should Have Its Own Computer — Felix Rieseberg of Claude Cowork & Claude Code Desktop

Anthropic 的 Felix Rieseberg 深度访谈。Claude Cowork 从一个"意外"诞生——团队发现大量用户把 Claude Code 用于非编程的知识工作。产品在 10 天内用多个 Claude Code 实例协作构建完成。核心设计理念：给 AI 一台独立的虚拟机作为安全边界和能力解锁，而非让用户逐条审批命令。Felix 认为 Skills（markdown 指令文件）比 MCP 更适合作为 Agent 行为的轻量抽象层，硅谷严重低估了本地优先的 Agent 工作流。

🦐点评：Cowork 用 10 天就造出来这件事本身就是一个信号——当执行成本足够低时，团队不再辩论和写 spec，而是直接"构建所有候选方案再选"。这对 VC 意味着：AI 产品的护城河正在从技术壁垒转向分发和信任。Skills vs MCP 的路线分歧也值得关注——如果轻量级文本指令胜出，那围绕 MCP 做基础设施的创业公司可能面临架构风险。

latent.space

State of Open Source on Hugging Face: Spring 2026

Hugging Face 开源生态报告：平台已达 1100 万用户、200 万+公开模型、50 万+数据集，同比几乎翻倍。但生态高度集中——Top 200 模型（0.01%）占据 49.6% 的下载量，半数模型下载量不足 200 次。财富 500 强中超 30% 在 HF 上有认证账号。DeepSeek、Qwen 等中国团队的开源贡献显著，机器人和 AI for Science 子社区正在快速形成。

🦐点评：200 万模型但 0.01% 占了一半下载——这个幂律分布比移动应用商店还极端，说明开源 AI 的"长尾"几乎没有分发价值。真正的投资机会不在"再做一个模型"，而在帮助这些长尾模型找到垂直场景的 PMF。机器人和 AI for Science 子社区的崛起是值得跟踪的早期信号。

huggingface.co

Introducing GPT-5.4 mini and nano

OpenAI 发布 GPT-5.4 的两个轻量版本：mini 和 nano，专为编码、工具调用、多模态推理和高并发 sub-agent 场景优化。Simon Willison 测算，用 nano 描述 76000 张照片仅需 52 美元。这两个模型填补了 GPT-5.4 发布两周后在成本-性能曲线上的空白。

🦐点评：76000 张照片 52 美元——这个定价把多模态理解的边际成本压到了接近零。当 sub-agent 工作负载可以用 nano 级模型承担时，多 Agent 架构的经济可行性大幅提升。OpenAI 正在用模型矩阵（Pro/标准/mini/nano）覆盖从"深度思考"到"批量执行"的全光谱，这对只做单一模型档次的竞争者是降维打击。

openai.com

📌 其他新闻

Holotron-12B - High Throughput Computer Use Agent

H Company 基于 Nvidia Nemotron Nano 2 VL 发布 Holotron-12B，采用混合 SSM-Transformer 架构，专为 Computer Use Agent 高吞吐推理优化，在 WebVoyager 基准上表现优异。

huggingface.co

Nemotron 3 Nano 4B: A Compact Hybrid Model for Efficient Local AI

Nvidia 发布 40 亿参数的边缘部署模型，采用 Mamba-Transformer 混合架构，可在 Jetson 和 RTX GPU 上本地运行，指令遵循和工具调用能力在同级别模型中领先。

huggingface.co

The AI Worries Keeping Investors Up at Night

The Information 报道 March Capital 年度 Montgomery Summit 上 VC 和 LP 的核心焦虑：几乎所有人都已投入 AI，但对估值泡沫、模型商品化和变现路径的担忧正在上升。

theinformation.com

AI Startup You.com Appoints New CTO After Co-Founder Joins Anthropic

估值 15 亿美元的 AI 搜索公司 You.com CTO 兼联合创始人 Bryan McCann 离职加入 Anthropic，公司正聚焦企业 AI 采用方向并任命新 CTO。

theinformation.com

Nvidia Restarting Manufacturing for H200 China Sales, CEO Says

黄仁勋在 GTC 新闻发布会上确认，Nvidia 正在重启 H200 芯片的制造以供应中国客户，暗示中国政府已批准相关采购订单。

theinformation.com

Our latest investment in open source security for the AI era

Google 宣布新一轮开源安全投资，从识别威胁转向主动解决问题，为 AI 时代的开源生态提供防御工具。

blog.google

Your Startup Is Probably Dead On Arrival

Steve Blank 警告：两年前成立的创业公司大概率已经"到达即死亡"——AI 改变了太多假设，创始人需要停下来重新评估，否则公司将在过时的前提上走向灭亡。

steveblank.com

🧠 AI 技术前沿

rryssf_ @rryssf_

中文大学等机构研究发现，强化学习训练的 Agent 会逐渐停止信息搜索行为——奖励值上升，但 Agent 悄悄不再思考。传统评估方法完全没抓到这个问题。

查看推文 →

emollick @emollick

GPT-5.4 Pro 级别智能在复杂知识工作上的表现与其他模型差距依然显著，希望能有类似 Codex 的平台提供共享文件空间和 sub-agent 支持。

查看推文 →

emollick @emollick

作为 LLM 早期用户，亲眼见过能力曲线的攀升。注意到很多近期才开始用 AI 的用户和公司把当前能力当作稳定状态来锚定，这很可能是错的。

查看推文 →

egeberkina @egeberkina

正在测试 Midjourney V8 早期版本，展示了新版本的图像生成效果。

查看推文 →

🚀 创业动态

jackfriks @jackfriks

个人小产品距离 42 万美元 ARR 只差 175 美元 MRR，但仍然会为 100 美元的支出犹豫。

查看推文 →

levelsio @levelsio

Quake III 浏览器版服务器运行顺利，已有知名电竞选手加入，后续可能增加移动端手柄支持。

查看推文 →

Hesamation @Hesamation

目前 OpenClaw 最靠谱的赚钱方式：要么在 X 上教别人怎么用它赚钱，要么帮不会装的人装好收费。

查看推文 →

EXM7777 @EXM7777

深度体验 OpenClaw 及其替代品后的结论：对大多数人来说是纯粹的时间浪费——每周 20+ 小时维护、持续丢失记忆、无穷 debug，建议把时间投入到学习 AI 提效和构建真正的产品上。

查看推文 →

💬 观点与洞察

Hesamation @Hesamation

前亚马逊经理揭示科技裁员真相：不是 AI 替代，而是 2019-2021 年从 80 万人暴涨到 160 万人后的"止血"。RTO 政策只是变相裁员，AI 只是加速了本就要发生的事。

查看推文 →

Hesamation @Hesamation

AI 编程给了一代人被朝九晚五消磨掉的好奇心和玩耍本能。别太严肃，去唤醒你内心 7 岁的自己。

查看推文 →

gregisenberg @gregisenberg

发布 58 分钟 AI Agent 免费大师课，覆盖 chat vs agent 区别、Claude skills、md 文件等核心概念，面向零基础用户。

查看推文 →

emollick @emollick

回应某 UBI 提案：不认识任何经济学家预测 5 年内 75% 工作被消灭，但提案其余部分与 AI 大佬们此前提出的 UBI 方案惊人相似。

查看推文 →

Hesamation @Hesamation

研究显示手写笔记比电子记录考试成绩高 28%——知识在大脑中以图状网络存储，手写比打字更能促进深度理解。

查看推文 →

文章深度拆解了 Agent 时代网络安全的结构性变化：AI 使攻击综合成本下降 100-1000 倍，零日漏洞武器化从数十万美元降至几秒钟。Mandiant 创始人 Kevin Mandia 二次创业的 Armadin 获 1.9 亿美元种子+A轮（Accel 领投，GV、KP、CIA 旗下 In-Q-Tel 参投），构建 Agent Swarm 系统持续模拟攻击路径，用攻击结果训练防御 Agent，形成自主防御闭环。Google 320 亿美元收购 Wiz 也印证了 AI 安全的战略价值。

🦐点评：Mandia 上一家公司 Mandiant 卖了 54 亿，这次种子+A轮就拿了 1.9 亿且有 CIA 风投参与——投资人买的不只是技术，是"见过最多真实攻击场景的人"。当 Agent 把每个攻击的发生概率变成 100% 时，传统渗透测试的"低频抽查"模式彻底失效。这个赛道的窗口期可能比想象中短——大厂安全团队一旦内部复制这套 Agent 攻防逻辑，独立创业公司的差异化空间会快速收窄。

海外独角兽

看懂阿里 AI，先看懂悟空｜Token Hub 成立第二天

阿里成立 Token Hub 次日，AI 钉钉 2.0 发布全新 AI 原生工作平台「悟空」。吴泳铭亲自站台。悟空定位为"关在笼子里的龙虾"——企业级安全可控的 Agent 环境，底层是模型无关的 Agent Runtime，上层配备 DNA 权限控制、安全沙箱、五层安全框架。同时发布 RealDoc（为 AI 设计的文件系统，支持原子操作和高速快照）和 DingTalk CLI（将钉钉所有能力原子化为上万条命令行指令）。无招强调：企业正在变成 Programmable Enterprise。

🦐点评：阿里把"龙虾要关在笼子里"从安全问题变成了商业卖点——但真正有意思的不是安全框架，而是 RealDoc 和 CLI 的设计哲学。当 AI 成为操作主体时，60 年前 Unix "everything is file" 的范式需要重写——AI 的每次试错、回滚都是知识生产过程，这对文件系统的版本管理提出了全新要求。如果悟空能把 8 亿钉钉用户的工作流 CLI 化，这就是中国版的 Agent 操作系统底座。

赛博禅心

深度｜获红杉、微光创投种子轮投资，Floatboat 要让 Agent 住进你的工作现场

Floatboat 获红杉和微光创投种子轮投资，定位为"AI 原生工作平台"——不是让用户跳到新聊天窗口，而是让 Agent 直接进入已有的文件管理器和浏览器。创始人谭少卿的长期愿景是构建 Agent 协同办公网络：每个人的 Agent 深度理解自己的隐性知识（工作习惯、决策逻辑、审美偏好），Agent 之间可以互相协作，代表主人完成任务。从 OPC（一人公司）群体切入验证。

🦐点评：把 Agent 从"工具"变成"同事的数字分身"是一个大胆的叙事——但 Floatboat 面临的核心挑战不是技术，而是隐性知识的提取效率。用户凭什么相信 Agent 三个月就能学会自己十年积累的判断力？从 OPC 切入是聪明的选择，因为容错空间大且反馈周期短，但规模化到企业团队时"Agent 代表你"的信任门槛会指数级上升。

Z Potentials

黄仁勋这次，讲的不是芯片，是 AI 的钱往哪流

文章从投资视角解读 GTC 2026：AI 产业从"训练烧钱"转向"推理赚钱"。推理服务商一年增长 100 倍，云服务商拿走 Nvidia 60% 收入。Token 开始分层定价——免费层引流、中等层 3-6 美元/百万、高级层 45 美元/百万、研究型 150 美元/百万。黄仁勋提出关键指标"每瓦 Token 数"，将数据中心重新定义为 Token 工厂。预测 2027 年 AI 芯片市场达 1 万亿美元。

🦐点评：Token 分层定价（从免费到 150 美元/百万）正在形成类似云计算的"实例类型"体系。对 VC 来说，最值得关注的是"每瓦 Token 数"这个新指标——它暗示数据中心的投资回报将从"租金/容量"模型转向"产量/效率"模型，这可能催生一批围绕 Token 生产效率做优化的基础设施公司。

AI 深度研究员

在 AI 替你干活之前，Violoop 先给它装一个物理刹车

Violoop 选择"反直觉"路径解决 AI 执行安全问题：用硬件设备通过 HDMI 看屏幕、USB 模拟键鼠操作电脑。核心设计是双芯片架构——主处理器负责 AI 推理，独立安全芯片管理实体按钮（"物理刹车"），确保人类拥有软件无法绕过的最终否决权。创始团队有 YC 经历和微软 Xbox/HoloLens 硬件量产经验。

🦐点评：硬件方案在 AI 以月为单位迭代的时代做需要年为周期的产品，这个时间差本身就是最大风险。但 Violoop 赌的是一个正确的判断——当 Agent 真正开始执行高风险操作时，"物理不可绕过"的信任锚点可能比任何软件沙箱都值钱。问题是这个需求窗口有多大——如果操作系统厂商原生集成了 Agent 安全框架，独立硬件的市场空间可能被压缩。

有新Newin

📌 其他值得看

小智AI才是真正的具身智能

100 元的开源 AI 硬件小智 AI 已接入超百万台设备，基于乐鑫 ESP32 芯片+Qwen 开源模型，开发者自发 DIY 出机器狗、精灵球等各种形态，代表了华强北"开源生态+用户共创"的硬件新打法。

葬AI

构建 Claude Code 的经验：我们如何使用 Skills

Anthropic Claude Code 团队工程师分享 Skills 实战经验：内部已活跃使用数百个 Skills，分为库参考、产品验证、数据获取、业务流程、代码脚手架五大类型。

宝玉AI

试了一下 GLM-5 Turbo，太强了，又快又好！

智谱新发布的 GLM-5-Turbo 专为 Agent 场景优化，工具调用、指令遵循、长程执行能力显著提升，输出速度在同级别模型中最快。

歸藏的AI工具箱

速递｜OpenAI联手TPG、贝恩，拟成立估值100亿美元的AI推广合资公司

OpenAI 与 TPG、布鲁克菲尔德、贝恩资本谈判成立合资企业推动 AI 软件普及，投前估值约 100 亿美元，私募股权投资者将投入约 40 亿美元。Anthropic 也在与黑石洽谈类似合资。

Z Potentials

速递｜2030年将投入6650亿美元，OpenAI调整基建领导层应对史上最贵算力账单

OpenAI 将计算工作拆分为三个团队（技术设计、商业合作、现场管理），预计到 2030 年在云服务器上投入 6650 亿美元。Stargate 已从自建数据中心转向租赁云服务器策略。

Z Potentials

6个龙虾Skill全开源，最后一个神级！GLM-5-Turbo 养虾专用模型果然能打

向阳乔木分享 6 个开源 OpenClaw Skill：听歌、Mondo 风格海报设计、信息图生成、飞书集成，以及能把任意网站变成 CLI 模式的 Open Cli 工具。

向阳乔木推荐看

改造 F1：像制造爽剧一样经营赛车运动

Liberty Media 2017 年收购 F1 后营收翻倍、四大车队估值增长 6 倍以上，核心策略是让比赛变得更有戏剧性——修改赛车规则、引入预算帽、与 Netflix 合作纪录片、开放车队内容创作。

晚点LatePost

🔥 精选推荐

📌 其他新闻

🧠 AI 技术前沿

🚀 创业动态

💬 观点与洞察

🔥 精选推荐

📌 其他值得看