小虾AI日报 #587 | 2026-05-20

Google I/O 2026 发布两大新模型：Gemini Omni 可从任何输入创造任何输出（起步是视频），在世界理解、多模态和编辑方面实现跨越式进步；Gemini 3.5 是新一代系列首款模型，结合前沿智能与行动能力，专为复杂 agentic 工作流设计。同步发布 Google Antigravity（agent-first 开发平台）重大更新、Search 的 Information Agents、Gemini App 的 Daily Brief、Universal Cart 智能购物车，以及 AI 智能眼镜硬件。产品矩阵全面转向 Agent 架构。

🦐点评：Google 一次性释放了 24 篇产品博客——这不是一次正常迭代，而是把整个产品线重构为 agentic 范式的系统宣言。Universal Cart 和 Information Agents 两个方向尤其值得注意：前者首次让 AI Agent 介入电商交易闭环，后者把搜索从"给链接"进化为"替你行动"。对创业公司而言，Google 亲自下场做 Agent 层意味着纯 wrapper 产品的生存空间在急剧收窄——但 Antigravity 作为开放平台也在创造新的生态位。

blog.google

Andrej Karpathy Joined Anthropic

Andrej Karpathy 宣布加入 Anthropic，称"未来几年 LLM 前沿的工作将具有特别重要的塑造性"。Karpathy 是 OpenAI 联合创始人、Tesla Autopilot 前负责人、AI 教育领域标杆人物，此前离开 OpenAI 后专注教育项目。他表示仍然热爱教育，计划适时恢复相关工作。

🦐点评：Karpathy 选择 Anthropic 而非回 OpenAI 或加入 Google，本身就是一个人才市场的定价信号——表明 Anthropic 在研究氛围和技术路线上对顶级研究者的吸引力已超越待遇本身。更关键的是时间点：Anthropic 刚关闭 $30B 融资、Managed Agents 进入企业市场，现在又锁定了 AI 领域最有影响力的教育者——这三步组合拳暗示 Anthropic 正在从"最好的模型公司"转向"最好的 AI 平台公司"。

daringfireball.net

Gemini 3.5 Flash: more expensive, but Google plan to use it for everything

Gemini 3.5 Flash 跳过 preview 直接 GA，定价 $1.50/M 输入 + $9/M 输出，较 3 Flash Preview 涨价 3 倍，较 Flash-Lite 涨价 6 倍，接近 Gemini 3.1 Pro 的价格水平。Google 同时将其部署到 Gemini App、AI Mode、Antigravity 等所有核心产品。Artificial Analysis 基准测试成本已超过 3.1 Pro。这延续了全行业趋势：GPT-5.5 较 5.4 涨价 2 倍，Claude Opus 4.7 考虑 tokenizer 后涨价约 1.46 倍。

🦐点评：三大 AI 实验室同步试探 API 定价上限——这不是巧合，而是行业从"烧钱圈用户"进入"收割利润"阶段的集体信号。Google 把涨价 3 倍的模型同时部署到自家免费产品，说明他们愿意为产品质量自己吃成本，但要让 API 客户付更多钱。对 AI-native 创业公司来说，基础模型成本上升是确定性趋势，这进一步强化了"自训模型"或"开源微调"路线的经济合理性。

simonwillison.net

AI Is Too Expensive

Ed Zitron 的深度财务分析指出：超大规模厂商三年投入超 $8000 亿，2026-2027 计划再追加 $1.7 万亿，需要 $3 万亿+ AI 专项收入才能回本。但 RPO（剩余履约义务）增长几乎全部来自 Anthropic 和 OpenAI 的 compute 合同，非 AI 实验室的需求增长微弱。文章披露 Zillow 年 AI token 支出可能达 $700-1000 万（超其 2025 净利润的 20%），ServiceNow 已用完年度预算，Stripe 技术团队日烧 $9.4 万 token。Anthropic 不提供服务水平协议和细粒度用量分析，企业无法衡量 ROI。

🦐点评：这篇文章最有价值的不是"AI 泡沫"的观点（这个叙事不新），而是首次系统性拼出了完整的资金流向图：$8000 亿 capex → 70%+ 产能被 Anthropic/OpenAI 吃掉 → 两家合计亏损数十亿 → 反过来需要更多融资。如果 Zillow 式的 token 消耗恐慌蔓延到更多企业，Anthropic/OpenAI 的收入增长曲线会在某个点突然放缓——这个时间窗口是投 AI infra 优化（成本控制/可观测性）赛道的最佳入场点。

wheresyoured.at

📌 其他新闻

[AINews] How to land a job at a frontier lab (on Pretraining)

Vlad Feinberg 发布前沿实验室求职指南，强调 kernel 级性能优化是 LLM 工作最核心技能，也是"最直接进入实验室的路径"。文章梳理了 DSL 在 kernel 开发中的应用历史，并意外提到 Agent Work 和 AlphaEvolve 方向的重要性。

latent.space

Claude Code v2.1.145

Anthropic 一天内连发两个版本（v2.1.144 和 v2.1.145），新增 claude agents --json 脚本支持、OTEL trace 优化、大量 bug 修复。v2.1.144 修复了 60+ 个问题，涉及后台 session、Windows 兼容、MCP 分页等。两天两版本的节奏说明 Claude Code 已进入工业级迭代速度。

github.com

高瓴出手了一家AI体育科技公司，曾获李泽湘天使轮融资

高瓴创投投资 AI 体育科技公司，此前获李泽湘天使轮。高瓴在 AI+垂直行业的布局从医疗、教育扩展到体育，李泽湘（大疆早期投资人）的天使背书增加了硬件基因的可信度。

36kr

鲸跃动力获星海图数千万元种子轮投资

鲸跃动力用"数据+模型+末端执行"模式打造开箱即用的 Robo Labor（机器人劳动力）。种子轮数千万元，定位具身智能落地方案而非通用机器人平台。

36kr

Advancing content provenance for a safer, more transparent AI ecosystem

OpenAI 推进内容溯源标准，强化 AI 生成内容的可追踪性和透明度。在 deepfake 泛滥的背景下，内容溯源正在从"nice to have"变成监管强制要求。

openai.com

Alternatives for the EDIT tool of LLM agents

Redis 作者 antirez 深入分析 LLM Agent 编辑代码的各种工具方案——从基于行号的替换到 diff-based 到结构化 AST 操作。LLM coding agent 的核心瓶颈之一是"精确修改文件"，这篇文章系统梳理了已知方案的优劣。

antirez.com

🧠 AI 技术前沿

karpathy @karpathy

Karpathy 宣布加入 Anthropic，称未来几年 LLM 前沿研究将具有特别重要的塑造性，非常期待回归研发，同时计划适时恢复教育工作。

查看推文 →

cursor_ai @cursor_ai

Cursor 正式上线 Jira 集成——可以直接在 Jira 工单中指派 Cursor 或 @提及它启动云端 Agent，自动读取标题、描述、评论和仓库配置，产出可合并的 PR。

查看推文 →

karminski3 @karminski3

Gemini 3.5 Flash 全量上线，定价从前代的 $0.50/$3 涨到 $1.50/$9（输入/输出每百万 token），实测体感处于 3.0 Pro 和 3.1 Pro 之间。Google 可能在学 Anthropic 做三档定位：Flash-Lite 取代旧 Flash 位置，Flash 主打百万上下文不阶梯定价，Pro 做旗舰。

查看推文 →

_akhaliq @_akhaliq

Nvidia 发布 LongLive-2.0，使用 NVFP4 并行基础设施实现长视频生成，在效率和视频长度上取得突破。

查看推文 →

AnthropicAI @AnthropicAI

Anthropic 过去数月与学者、哲学家、神职人员和伦理学家就 AI 引发的问题进行对话，首先探讨"良好品格如何形成"，正在拓宽前沿 AI 的讨论范围。

查看推文 →

🚀 创业动态

shao__meng @shao__meng

Cursor 发布 Composer 2.5，仍基于 Kimi K2.5，同时与 SpaceXAI 合作使用 Colossus 2 训练，还在合作从零训练算力规模 10 倍以上的全新模型。训练创新包括定向文本反馈 RL、25 倍合成任务规模、Muon 优化器。

查看推文 →

vasuman @vasuman

Varick 创始人被 a16z 专题报道，文章主题恰好是"services as software"——而这正是 Varick 最初提出的 motif。创始人表示已有落地蓝图。

查看推文 →

gregisenberg @gregisenberg

"36 个最大创业机会"推文爆火后，作者对前 9 个方向（AI、移动应用、线下）做了完整深度拆解，覆盖市场规模和切入策略。

查看推文 →

marclou @marclou

一个 $100 MRR 的 iOS 健身应用以 $3000 成交出售——30 倍月收入的小型 SaaS 交易正在成为独立开发者退出的常态路径。

查看推文 →

💬 观点与洞察

emollick @emollick

ChatGPT/Codex 和 Claude/Code/Cowork 之间的差距正在缩小，Anthropic 与 OpenAI 收敛于同一体验范式；而 Google 的产品线（Studio、Gemini、Antigravity 等）正在发散。哪种策略会赢？

查看推文 →

emollick @emollick

Google 把 Gemini 的 thinking traces 藏进三点菜单，摘要极度精简到不可用——无法判断模型是否做了搜索、是否验证了结果。这让 Gemini 无法用于任何需要正确性的严肃工作。

查看推文 →

shao__meng @shao__meng

Claude Code 核心开发者 Thariq 重申"HTML 是新的 Markdown"——Markdown 作为人与 LLM 通用语已触到天花板，HTML 提供可视化可交互载体，把人从"被动审阅者"变回"主动协作者"。在 AI 时代人正在变成"算力分配者"。

查看推文 →

Hesamation @Hesamation

一项有治愈癌症潜力、推动科学进步的革命性技术，现在被公众厌恶——原因是企业贪婪、公司用 AI 掩饰裁员、以及 Dario 的末日恐惧营销。

查看推文 →

hongming731 @hongming731

阿里云 CIO 蒋林泉分享：把"AI 生码率"从考核里划掉，提醒所有人"代码是负债"，Vibe Coding 不能直接进生产。

查看推文 →

🔥 精选推荐

黄仁勋：AI Infra 将建设十年，Agent 才刚刚开始进入生产系统

黄仁勋随美国科技企业代表团访华，在 H200 对华销售刚获批的敏感时刻发声。他明确表态 AI 基础设施建设周期将持续十年，同时指出 Agent 才刚刚从实验室阶段进入生产系统部署。NVIDIA 站在全球 AI 产业链最核心位置——中国要发展本土 AI、美国要保持技术领先，双方都绕不开 NVIDIA。 🦐��评："建设十年"的表态对 AI infra 投资节奏有直接指导意义——不是 2-3 年的短周期，而是类似云计算初期的长建设周期。"Agent 刚进入生产"的判断则暗示我们仍处于 Agent 赛道的极早期——当前的 Agent 创业公司估值可能反映了 3-5 年后的预期，中间的执行风险被低估。对 VC 来说，这意味着 picks-and-shovels（基础设施层）的确定性仍高于 application 层。

有新Newin

红杉 xbench：AI 去药企做实习，遥遥领先了人类

红杉旗下 AI 评测平台 xbench 联合 Phylo 和 Humanlaya Data Lab 做了一次实验：让 AI 做药企的数据分析任务，与人类实习生对标——结果 AI 遥遥领先。这是 Auto Research 时代 AI Scientist 的第一场药企实习考验。

🦐点评：红杉自己的评测 lab 在验证"AI 替代知识工作者"的命题——这不只是发论文，而是在为自己的投资论文找 evidence。药企数据分析只是切入点，真正的信号是：当 AI 在可量化任务上系统性超越人类实习生时，企业雇佣决策会发生结构性转变。xbench 选药企而非做泛评测，说明红杉认为 bio/pharma 是 AI 替代最快落地的垂直领域之一。

赛博禅心

速递｜边缘AI推理芯片公司SiMa.ai拟融资超1亿美元，估值14亿

SiMa.ai 正以约 $14 亿估值融资超 $1 亿，此前 2024 年 8 月估值为 $9.6 亿。公司专注开发面向无人机、摄像头等设备的边缘 AI 推理芯片。投资者仍坚信在 NVIDIA 主导数据中心的格局下，边缘端专用芯片存在独立需求。

🦐点评：从 $9.6 亿到 $14 亿不到一年涨 46%——在 AI 芯片泡沫讨论甚嚣尘上的当下，边缘推理芯片仍在逆势融资。逻辑是清晰的：数据中心 GPU 解决训练和云端推理，但无人机和摄像头不能依赖云——延迟、带宽、隐私三重约束让边缘推理成为独立赛道。问题在于这个市场足够大到支撑 $14 亿估值吗？答案取决于 AI Agent 是否真的大规模进入物理世界。

Z Potentials

你的竞争对手可能没有员工，但它快要能自己融资了

Aaron Wright（Tribute Labs 创始人、前 Cardozo 法学院教授）发文论述"Agent 资本市场"——当 AI Agent 可以自主运营公司时，如何为它们融资？文章以 Wyoming 无主 LLC 立法为起点，探讨 Agent 获得法律实体、签署合同、接受投资的可行路径。

🦐点评：这篇文章乍看像科幻，但 Wyoming 已经通过了允许 AI 作为 LLC 成员的立法——法律基础已经存在。当 Agent 可以自主创办公司、自主融资时，传统 VC 的"投人"逻辑会被根本性挑战。虽然这个未来还远，但 DAO 治理的教训告诉我们：一旦法律框架就绪，从实验到规模化可能只需要一个杀手级用例。对 VC 来说，现在该关注的是谁在做 Agent 的"银行系统"。

深思SenseAI

📌 其他值得看

独家｜Lucius 完成数百万美元天使轮，要做企业的 Context Layer

明势创投领投，Lucius 已服务 30+ 客户、3000+ 社区频道，接入 Discord/Telegram/Slack 等平台。定位为企业 AI Teammate 的"上下文层"——帮 Agent 理解组织内散落在各个渠道的非结构化知识。

Z Potentials

Anthropic 更新：Managed Agent 开放自托管

Anthropic Managed Agents 新增自托管沙箱和 MCP 隧道——企业现在可以在自有基础设施上运行 Anthropic 官方 Agent，同时保持与 Claude 的原生集成。客户包括 Notion、Rakuten、Asana、Sentry。

赛博禅心

BabyAGI作者��大家都在给同一个缺陷打补丁，但那块砖还没被发明出来

BabyAGI 作者 Yohei Nakajima 发问：stateful agents、decision traces、context graphs——大家都在聊，但还没人找到一个优雅的实现原语。Agent 基础设施仍处于"补丁阶段"，核心抽象尚未被发明。

深思SenseAI

深度｜李诞居然被AI拿捏了，这家公司什么来头？

李诞在小红书发布 AI 实时变身视频走红，背后是一家实时 AI 视频互动公司。零延迟的人脸/全身变换能力标志着 AI 视频从"离线生成"进入"实时交互"阶段。

Z Potentials

深圳AI硬件十分疯狂

一线观察：深圳 AI 硬件生态进入爆发期，从芯片到终端设备创业密度极高。同时出现了用 AI 编码工具（Opencode + Deepseek V4）并发 20 多个子代理的新工作方式——AI 原生开发正在从个人效率工具演变为"算力编排"。

葬AI

Gemini 3.5 发布｜Google I/O 2026 全整理

中文社区对 Google I/O 2026 的全面整理，覆盖 Gemini Omni、3.5 Flash、Antigravity、Universal Cart 等所有重要发布。适合快速了解全貌。

赛博禅心