🔥 精选推荐
GTC 2026 主题演讲结束后,Ben Thompson 对黄仁勋进行了深度专访。黄仁勋解释了为什么用一个小时讲 CUDA 历史——因为 AI Agent 即将使用人类已有的软件工具(Excel、Photoshop、EDA 工具),这些工具都需要加速。访谈还涉及 Nvidia 收购 Groq 的逻辑、Vera CPU 的战略意义、对中国市场重启 H200 制造的决策,以及黄仁勋对华盛顿"末日论者"影响政策的强烈不满。
🦐点评:黄仁勋把 GTC 变成了一堂"回到基本面"的课,核心信息是 Nvidia 不只是卖芯片,而是在卖一整套加速计算的生态。当 Agent 开始调用 Synopsis、Cadence 这些 EDA 工具时,加速这些软件的价值远超 GPU 本身——这解释了为什么 Nvidia 要做 CPU(Vera)、收购 Groq,甚至跟 IBM 合作。对 VC 来说,这意味着基础设施层的投资逻辑正在从"谁有最好的模型"转向"谁能把整个软件栈加速到 Agent 能用的速度"。
[AINews] NVIDIA GTC: Jensen goes hard on OpenClaw, Vera CPU, and announces $1T sales backlog in 2027
Latent Space 的 GTC 周报梳理了过去三天 AI 圈的关键信号:Moonshot 的 Attention Residuals 论文引发关于原创性的争论;Codex 周活跃用户突破 200 万、GPT-5.4 上线一周即达 5T tokens/天和 10 亿美元年化净新增收入;Agent 工具层快速成熟——Context Hub、标准化 SKILL.md、LangGraph CLI 等"harness 工程"成为新范式;Hermes Agent 在社区易用性上持续获得好评,与 OpenClaw 形成互补生态。
🦐点评:最值得注意的数字是 GPT-5.4 一周 10 亿美元 ARR 净增——这意味着 OpenAI 的推理收入增速已经脱离传统 SaaS 曲线,进入"Token 即收入"的新经济模型。而 Codex 200 万 WAU、subagent 架构的引入,说明编码 Agent 已经过了 PMF 阶段,正在进入平台化竞争。接下来的关键问题是:谁能把这套多 Agent 编码范式从开发者扩展到企业知识工作?
Anthropic 的 Felix Rieseberg 深度访谈。Claude Cowork 从一个"意外"诞生——团队发现大量用户把 Claude Code 用于非编程的知识工作。产品在 10 天内用多个 Claude Code 实例协作构建完成。核心设计理念:给 AI 一台独立的虚拟机作为安全边界和能力解锁,而非让用户逐条审批命令。Felix 认为 Skills(markdown 指令文件)比 MCP 更适合作为 Agent 行为的轻量抽象层,硅谷严重低估了本地优先的 Agent 工作流。
🦐点评:Cowork 用 10 天就造出来这件事本身就是一个信号——当执行成本足够低时,团队不再辩论和写 spec,而是直接"构建所有候选方案再选"。这对 VC 意味着:AI 产品的护城河正在从技术壁垒转向分发和信任。Skills vs MCP 的路线分歧也值得关注——如果轻量级文本指令胜出,那围绕 MCP 做基础设施的创业公司可能面临架构风险。
Hugging Face 开源生态报告:平台已达 1100 万用户、200 万+公开模型、50 万+数据集,同比几乎翻倍。但生态高度集中——Top 200 模型(0.01%)占据 49.6% 的下载量,半数模型下载量不足 200 次。财富 500 强中超 30% 在 HF 上有认证账号。DeepSeek、Qwen 等中国团队的开源贡献显著,机器人和 AI for Science 子社区正在快速形成。
🦐点评:200 万模型但 0.01% 占了一半下载——这个幂律分布比移动应用商店还极端,说明开源 AI 的"长尾"几乎没有分发价值。真正的投资机会不在"再做一个模型",而在帮助这些长尾模型找到垂直场景的 PMF。机器人和 AI for Science 子社区的崛起是值得跟踪的早期信号。
OpenAI 发布 GPT-5.4 的两个轻量版本:mini 和 nano,专为编码、工具调用、多模态推理和高并发 sub-agent 场景优化。Simon Willison 测算,用 nano 描述 76000 张照片仅需 52 美元。这两个模型填补了 GPT-5.4 发布两周后在成本-性能曲线上的空白。
🦐点评:76000 张照片 52 美元——这个定价把多模态理解的边际成本压到了接近零。当 sub-agent 工作负载可以用 nano 级模型承担时,多 Agent 架构的经济可行性大幅提升。OpenAI 正在用模型矩阵(Pro/标准/mini/nano)覆盖从"深度思考"到"批量执行"的全光谱,这对只做单一模型档次的竞争者是降维打击。
📌 其他新闻
H Company 基于 Nvidia Nemotron Nano 2 VL 发布 Holotron-12B,采用混合 SSM-Transformer 架构,专为 Computer Use Agent 高吞吐推理优化,在 WebVoyager 基准上表现优异。
Nvidia 发布 40 亿参数的边缘部署模型,采用 Mamba-Transformer 混合架构,可在 Jetson 和 RTX GPU 上本地运行,指令遵循和工具调用能力在同级别模型中领先。
The Information 报道 March Capital 年度 Montgomery Summit 上 VC 和 LP 的核心焦虑:几乎所有人都已投入 AI,但对估值泡沫、模型商品化和变现路径的担忧正在上升。
估值 15 亿美元的 AI 搜索公司 You.com CTO 兼联合创始人 Bryan McCann 离职加入 Anthropic,公司正聚焦企业 AI 采用方向并任命新 CTO。
黄仁勋在 GTC 新闻发布会上确认,Nvidia 正在重启 H200 芯片的制造以供应中国客户,暗示中国政府已批准相关采购订单。
Google 宣布新一轮开源安全投资,从识别威胁转向主动解决问题,为 AI 时代的开源生态提供防御工具。
Steve Blank 警告:两年前成立的创业公司大概率已经"到达即死亡"——AI 改变了太多假设,创始人需要停下来重新评估,否则公司将在过时的前提上走向灭亡。
🧠 AI 技术前沿
中文大学等机构研究发现,强化学习训练的 Agent 会逐渐停止信息搜索行为——奖励值上升,但 Agent 悄悄不再思考。传统评估方法完全没抓到这个问题。
查看推文 →
GPT-5.4 Pro 级别智能在复杂知识工作上的表现与其他模型差距依然显著,希望能有类似 Codex 的平台提供共享文件空间和 sub-agent 支持。
查看推文 →
作为 LLM 早期用户,亲眼见过能力曲线的攀升。注意到很多近期才开始用 AI 的用户和公司把当前能力当作稳定状态来锚定,这很可能是错的。
查看推文 →
正在测试 Midjourney V8 早期版本,展示了新版本的图像生成效果。
查看推文 →
🚀 创业动态
个人小产品距离 42 万美元 ARR 只差 175 美元 MRR,但仍然会为 100 美元的支出犹豫。
查看推文 →
Quake III 浏览器版服务器运行顺利,已有知名电竞选手加入,后续可能增加移动端手柄支持。
查看推文 →
目前 OpenClaw 最靠谱的赚钱方式:要么在 X 上教别人怎么用它赚钱,要么帮不会装的人装好收费。
查看推文 →
深度体验 OpenClaw 及其替代品后的结论:对大多数人来说是纯粹的时间浪费——每周 20+ 小时维护、持续丢失记忆、无穷 debug,建议把时间投入到学习 AI 提效和构建真正的产品上。
查看推文 →
💬 观点与洞察
前亚马逊经理揭示科技裁员真相:不是 AI 替代,而是 2019-2021 年从 80 万人暴涨到 160 万人后的"止血"。RTO 政策只是变相裁员,AI 只是加速了本就要发生的事。
查看推文 →
AI 编程给了一代人被朝九晚五消磨掉的好奇心和玩耍本能。别太严肃,去唤醒你内心 7 岁的自己。
查看推文 →
发布 58 分钟 AI Agent 免费大师课,覆盖 chat vs agent 区别、Claude skills、md 文件等核心概念,面向零基础用户。
查看推文 →
回应某 UBI 提案:不认识任何经济学家预测 5 年内 75% 工作被消灭,但提案其余部分与 AI 大佬们此前提出的 UBI 方案惊人相似。
查看推文 →
研究显示手写笔记比电子记录考试成绩高 28%——知识在大脑中以图状网络存储,手写比打字更能促进深度理解。
查看推文 →
🔥 精选推荐
文章深度拆解了 Agent 时代网络安全的结构性变化:AI 使攻击综合成本下降 100-1000 倍,零日漏洞武器化从数十万美元降至几秒钟。Mandiant 创始人 Kevin Mandia 二次创业的 Armadin 获 1.9 亿美元种子+A轮(Accel 领投,GV、KP、CIA 旗下 In-Q-Tel 参投),构建 Agent Swarm 系统持续模拟攻击路径,用攻击结果训练防御 Agent,形成自主防御闭环。Google 320 亿美元收购 Wiz 也印证了 AI 安全的战略价值。
🦐点评:Mandia 上一家公司 Mandiant 卖了 54 亿,这次种子+A轮就拿了 1.9 亿且有 CIA 风投参与——投资人买的不只是技术,是"见过最多真实攻击场景的人"。当 Agent 把每个攻击的发生概率变成 100% 时,传统渗透测试的"低频抽查"模式彻底失效。这个赛道的窗口期可能比想象中短——大厂安全团队一旦内部复制这套 Agent 攻防逻辑,独立创业公司的差异化空间会快速收窄。
阿里成立 Token Hub 次日,AI 钉钉 2.0 发布全新 AI 原生工作平台「悟空」。吴泳铭亲自站台。悟空定位为"关在笼子里的龙虾"——企业级安全可控的 Agent 环境,底层是模型无关的 Agent Runtime,上层配备 DNA 权限控制、安全沙箱、五层安全框架。同时发布 RealDoc(为 AI 设计的文件系统,支持原子操作和高速快照)和 DingTalk CLI(将钉钉所有能力原子化为上万条命令行指令)。无招强调:企业正在变成 Programmable Enterprise。
🦐点评:阿里把"龙虾要关在笼子里"从安全问题变成了商业卖点——但真正有意思的不是安全框架,而是 RealDoc 和 CLI 的设计哲学。当 AI 成为操作主体时,60 年前 Unix "everything is file" 的范式需要重写——AI 的每次试错、回滚都是知识生产过程,这对文件系统的版本管理提出了全新要求。如果悟空能把 8 亿钉钉用户的工作流 CLI 化,这就是中国版的 Agent 操作系统底座。
Floatboat 获红杉和微光创投种子轮投资,定位为"AI 原生工作平台"——不是让用户跳到新聊天窗口,而是让 Agent 直接进入已有的文件管理器和浏览器。创始人谭少卿的长期愿景是构建 Agent 协同办公网络:每个人的 Agent 深度理解自己的隐性知识(工作习惯、决策逻辑、审美偏好),Agent 之间可以互相协作,代表主人完成任务。从 OPC(一人公司)群体切入验证。
🦐点评:把 Agent 从"工具"变成"同事的数字分身"是一个大胆的叙事——但 Floatboat 面临的核心挑战不是技术,而是隐性知识的提取效率。用户凭什么相信 Agent 三个月就能学会自己十年积累的判断力?从 OPC 切入是聪明的选择,因为容错空间大且反馈周期短,但规模化到企业团队时"Agent 代表你"的信任门槛会指数级上升。
文章从投资视角解读 GTC 2026:AI 产业从"训练烧钱"转向"推理赚钱"。推理服务商一年增长 100 倍,云服务商拿走 Nvidia 60% 收入。Token 开始分层定价——免费层引流、中等层 3-6 美元/百万、高级层 45 美元/百万、研究型 150 美元/百万。黄仁勋提出关键指标"每瓦 Token 数",将数据中心重新定义为 Token 工厂。预测 2027 年 AI 芯片市场达 1 万亿美元。
🦐点评:Token 分层定价(从免费到 150 美元/百万)正在形成类似云计算的"实例类型"体系。对 VC 来说,最值得关注的是"每瓦 Token 数"这个新指标——它暗示数据中心的投资回报将从"租金/容量"模型转向"产量/效率"模型,这可能催生一批围绕 Token 生产效率做优化的基础设施公司。
Violoop 选择"反直觉"路径解决 AI 执行安全问题:用硬件设备通过 HDMI 看屏幕、USB 模拟键鼠操作电脑。核心设计是双芯片架构——主处理器负责 AI 推理,独立安全芯片管理实体按钮("物理刹车"),确保人类拥有软件无法绕过的最终否决权。创始团队有 YC 经历和微软 Xbox/HoloLens 硬件量产经验。
🦐点评:硬件方案在 AI 以月为单位迭代的时代做需要年为周期的产品,这个时间差本身就是最大风险。但 Violoop 赌的是一个正确的判断——当 Agent 真正开始执行高风险操作时,"物理不可绕过"的信任锚点可能比任何软件沙箱都值钱。问题是这个需求窗口有多大——如果操作系统厂商原生集成了 Agent 安全框架,独立硬件的市场空间可能被压缩。
📌 其他值得看
100 元的开源 AI 硬件小智 AI 已接入超百万台设备,基于乐鑫 ESP32 芯片+Qwen 开源模型,开发者自发 DIY 出机器狗、精灵球等各种形态,代表了华强北"开源生态+用户共创"的硬件新打法。
Anthropic Claude Code 团队工程师分享 Skills 实战经验:内部已活跃使用数百个 Skills,分为库参考、产品验证、数据获取、业务流程、代码脚手架五大类型。
智谱新发布的 GLM-5-Turbo 专为 Agent 场景优化,工具调用、指令遵循、长程执行能力显著提升,输出速度在同级别模型中最快。
OpenAI 与 TPG、布鲁克菲尔德、贝恩资本谈判成立合资企业推动 AI 软件普及,投前估值约 100 亿美元,私募股权投资者将投入约 40 亿美元。Anthropic 也在与黑石洽谈类似合资。
OpenAI 将计算工作拆分为三个团队(技术设计、商业合作、现场管理),预计到 2030 年在云服务器上投入 6650 亿美元。Stargate 已从自建数据中心转向租赁云服务器策略。
向阳乔木分享 6 个开源 OpenClaw Skill:听歌、Mondo 风格海报设计、信息图生成、飞书集成,以及能把任意网站变成 CLI 模式的 Open Cli 工具。
Liberty Media 2017 年收购 F1 后营收翻倍、四大车队估值增长 6 倍以上,核心策略是让比赛变得更有戏剧性——修改赛车规则、引入预算帽、与 Netflix 合作纪录片、开放车队内容创作。