🔥 精选推荐
Google I/O 2026 发布两大新模型:Gemini Omni 可从任何输入创造任何输出(起步是视频),在世界理解、多模态和编辑方面实现跨越式进步;Gemini 3.5 是新一代系列首款模型,结合前沿智能与行动能力,专为复杂 agentic 工作流设计。同步发布 Google Antigravity(agent-first 开发平台)重大更新、Search 的 Information Agents、Gemini App 的 Daily Brief、Universal Cart 智能购物车,以及 AI 智能眼镜硬件。产品矩阵全面转向 Agent 架构。
🦐点评:Google 一次性释放了 24 篇产品博客——这不是一次正常迭代,而是把整个产品线重构为 agentic 范式的系统宣言。Universal Cart 和 Information Agents 两个方向尤其值得注意:前者首次让 AI Agent 介入电商交易闭环,后者把搜索从"给链接"进化为"替你行动"。对创业公司而言,Google 亲自下场做 Agent 层意味着纯 wrapper 产品的生存空间在急剧收窄——但 Antigravity 作为开放平台也在创造新的生态位。
Andrej Karpathy 宣布加入 Anthropic,称"未来几年 LLM 前沿的工作将具有特别重要的塑造性"。Karpathy 是 OpenAI 联合创始人、Tesla Autopilot 前负责人、AI 教育领域标杆人物,此前离开 OpenAI 后专注教育项目。他表示仍然热爱教育,计划适时恢复相关工作。
🦐点评:Karpathy 选择 Anthropic 而非回 OpenAI 或加入 Google,本身就是一个人才市场的定价信号——表明 Anthropic 在研究氛围和技术路线上对顶级研究者的吸引力已超越待遇本身。更关键的是时间点:Anthropic 刚关闭 $30B 融资、Managed Agents 进入企业市场,现在又锁定了 AI 领域最有影响力的教育者——这三步组合拳暗示 Anthropic 正在从"最好的模型公司"转向"最好的 AI 平台公司"。
Gemini 3.5 Flash 跳过 preview 直接 GA,定价 $1.50/M 输入 + $9/M 输出,较 3 Flash Preview 涨价 3 倍,较 Flash-Lite 涨价 6 倍,接近 Gemini 3.1 Pro 的价格水平。Google 同时将其部署到 Gemini App、AI Mode、Antigravity 等所有核心产品。Artificial Analysis 基准测试成本已超过 3.1 Pro。这延续了全行业趋势:GPT-5.5 较 5.4 涨价 2 倍,Claude Opus 4.7 考虑 tokenizer 后涨价约 1.46 倍。
🦐点评:三大 AI 实验室同步试探 API 定价上限——这不是巧合,而是行业从"烧钱圈用户"进入"收割利润"阶段的集体信号。Google 把涨价 3 倍的模型同时部署到自家免费产品,说明他们愿意为产品质量自己吃成本,但要让 API 客户付更多钱。对 AI-native 创业公司来说,基础模型成本上升是确定性趋势,这进一步强化了"自训模型"或"开源微调"路线的经济合理性。
Ed Zitron 的深度财务分析指出:超大规模厂商三年投入超 $8000 亿,2026-2027 计划再追加 $1.7 万亿,需要 $3 万亿+ AI 专项收入才能回本。但 RPO(剩余履约义务)增长几乎全部来自 Anthropic 和 OpenAI 的 compute 合同,非 AI 实验室的需求增长微弱。文章披露 Zillow 年 AI token 支出可能达 $700-1000 万(超其 2025 净利润的 20%),ServiceNow 已用完年度预算,Stripe 技术团队日烧 $9.4 万 token。Anthropic 不提供服务水平协议和细粒度用量分析,企业无法衡量 ROI。
🦐点评:这篇文章最有价值的不是"AI 泡沫"的观点(这个叙事不新),而是首次系统性拼出了完整的资金流向图:$8000 亿 capex → 70%+ 产能被 Anthropic/OpenAI 吃掉 → 两家合计亏损数十亿 → 反过来需要更多融资。如果 Zillow 式的 token 消耗恐慌蔓延到更多企业,Anthropic/OpenAI 的收入增长曲线会在某个点突然放缓——这个时间窗口是投 AI infra 优化(成本控制/可观测性)赛道的最佳入场点。
📌 其他新闻
Vlad Feinberg 发布前沿实验室求职指南,强调 kernel 级性能优化是 LLM 工作最核心技能,也是"最直接进入实验室的路径"。文章梳理了 DSL 在 kernel 开发中的应用历史,并意外提到 Agent Work 和 AlphaEvolve 方向的重要性。
Anthropic 一天内连发两个版本(v2.1.144 和 v2.1.145),新增 claude agents --json 脚本支持、OTEL trace 优化、大量 bug 修复。v2.1.144 修复了 60+ 个问题,涉及后台 session、Windows 兼容、MCP 分页等。两天两版本的节奏说明 Claude Code 已进入工业级迭代速度。
高瓴创投投资 AI 体育科技公司,此前获李泽湘天使轮。高瓴在 AI+垂直行业的布局从医疗、教育扩展到体育,李泽湘(大疆早期投资人)的天使背书增加了硬件基因的可信度。
鲸跃动力用"数据+模型+末端执行"模式打造开箱即用的 Robo Labor(机器人劳动力)。种子轮数千万元,定位具身智能落地方案而非通用机器人平台。
OpenAI 推进内容溯源标准,强化 AI 生成内容的可追踪性和透明度。在 deepfake 泛滥的背景下,内容溯源正在从"nice to have"变成监管强制要求。
Redis 作者 antirez 深入分析 LLM Agent 编辑代码的各种工具方案——从基于行号的替换到 diff-based 到结构化 AST 操作。LLM coding agent 的核心瓶颈之一是"精确修改文件",这篇文章系统梳理了已知方案的优劣。
🧠 AI 技术前沿
Karpathy 宣布加入 Anthropic,称未来几年 LLM 前沿研究将具有特别重要的塑造性,非常期待回归研发,同时计划适时恢复教育工作。
查看推文 →
Cursor 正式上线 Jira 集成——可以直接在 Jira 工单中指派 Cursor 或 @提及它启动云端 Agent,自动读取标题、描述、评论和仓库配置,产出可合并的 PR。
查看推文 →
Gemini 3.5 Flash 全量上线,定价从前代的 $0.50/$3 涨到 $1.50/$9(输入/输出每百万 token),实测体感处于 3.0 Pro 和 3.1 Pro 之间。Google 可能在学 Anthropic 做三档定位:Flash-Lite 取代旧 Flash 位置,Flash 主打百万上下文不阶梯定价,Pro 做旗舰。
查看推文 →
Nvidia 发布 LongLive-2.0,使用 NVFP4 并行基础设施实现长视频生成,在效率和视频长度上取得突破。
查看推文 →
Anthropic 过去数月与学者、哲学家、神职人员和伦理学家就 AI 引发的问题进行对话,首先探讨"良好品格如何形成",正在拓宽前沿 AI 的讨论范围。
查看推文 →
🚀 创业动态
Cursor 发布 Composer 2.5,仍基于 Kimi K2.5,同时与 SpaceXAI 合作使用 Colossus 2 训练,还在合作从零训练算力规模 10 倍以上的全新模型。训练创新包括定向文本反馈 RL、25 倍合成任务规模、Muon 优化器。
查看推文 →
Varick 创始人被 a16z 专题报道,文章主题恰好是"services as software"——而这正是 Varick 最初提出的 motif。创始人表示已有落地蓝图。
查看推文 →
"36 个最大创业机会"推文爆火后,作者对前 9 个方向(AI、移动应用、线下)做了完整深度拆解,覆盖市场规模和切入策略。
查看推文 →
一个 $100 MRR 的 iOS 健身应用以 $3000 成交出售——30 倍月收入的小型 SaaS 交易正在成为独立开发者退出的常态路径。
查看推文 →
💬 观点与洞察
ChatGPT/Codex 和 Claude/Code/Cowork 之间的差距正在缩小,Anthropic 与 OpenAI 收敛于同一体验范式;而 Google 的产品线(Studio、Gemini、Antigravity 等)正在发散。哪种策略会赢?
查看推文 →
Google 把 Gemini 的 thinking traces 藏进三点菜单,摘要极度精简到不可用——无法判断模型是否做了搜索、是否验证了结果。这让 Gemini 无法用于任何需要正确性的严肃工作。
查看推文 →
Claude Code 核心开发者 Thariq 重申"HTML 是新的 Markdown"——Markdown 作为人与 LLM 通用语已触到天花板,HTML 提供可视化可交互载体,把人从"被动审阅者"变回"主动协作者"。在 AI 时代人正在变成"算力分配者"。
查看推文 →
一项有治愈癌症潜力、推动科学进步的革命性技术,现在被公众厌恶——原因是企业贪婪、公司用 AI 掩饰裁员、以及 Dario 的末日恐惧营销。
查看推文 →
阿里云 CIO 蒋林泉分享:把"AI 生码率"从考核里划掉,提醒所有人"代码是负债",Vibe Coding 不能直接进生产。
查看推文 →
🔥 精选推荐
黄仁勋随美国科技企业代表团访华,在 H200 对华销售刚获批的敏感时刻发声。他明确表态 AI 基础设施建设周期将持续十年,同时指出 Agent 才刚刚从实验室阶段进入生产系统部署。NVIDIA 站在全球 AI 产业链最核心位置——中国要发展本土 AI、美国要保持技术领先,双方都绕不开 NVIDIA。 🦐���评:"建设十年"的表态对 AI infra 投资节奏有直接指导意义——不是 2-3 年的短周期,而是类似云计算初期的长建设周期。"Agent 刚进入生产"的判断则暗示我们仍处于 Agent 赛道的极早期——当前的 Agent 创业公司估值可能反映了 3-5 年后的预期,中间的执行风险被低估。对 VC 来说,这意味着 picks-and-shovels(基础设施层)的确定性仍高于 application 层。
红杉旗下 AI 评测平台 xbench 联合 Phylo 和 Humanlaya Data Lab 做了一次实验:让 AI 做药企的数据分析任务,与人类实习生对标——结果 AI 遥遥领先。这是 Auto Research 时代 AI Scientist 的第一场药企实习考验。
🦐点评:红杉自己的评测 lab 在验证"AI 替代知识工作者"的命题——这不只是发论文,而是在为自己的投资论文找 evidence。药企数据分析只是切入点,真正的信号是:当 AI 在可量化任务上系统性超越人类实习生时,企业雇佣决策会发生结构性转变。xbench 选药企而非做泛评测,说明红杉认为 bio/pharma 是 AI 替代最快落地的垂直领域之一。
SiMa.ai 正以约 $14 亿估值融资超 $1 亿,此前 2024 年 8 月估值为 $9.6 亿。公司专注开发面向无人机、摄像头等设备的边缘 AI 推理芯片。投资者仍坚信在 NVIDIA 主导数据中心的格局下,边缘端专用芯片存在独立需求。
🦐点评:从 $9.6 亿到 $14 亿不到一年涨 46%——在 AI 芯片泡沫讨论甚嚣尘上的当下,边缘推理芯片仍在逆势融资。逻辑是清晰的:数据中心 GPU 解决训练和云端推理,但无人机和摄像头不能依赖云——延迟、带宽、隐私三重约束让边缘推理成为独立赛道。问题在于这个市场足够大到支撑 $14 亿估值吗?答案取决于 AI Agent 是否真的大规模进入物理世界。
Aaron Wright(Tribute Labs 创始人、前 Cardozo 法学院教授)发文论述"Agent 资本市场"——当 AI Agent 可以自主运营公司时,如何为它们融资?文章以 Wyoming 无主 LLC 立法为起点,探讨 Agent 获得法律实体、签署合同、接受投资的可行路径。
🦐点评:这篇文章乍看像科幻,但 Wyoming 已经通过了允许 AI 作为 LLC 成员的立法——法律基础已经存在。当 Agent 可以自主创办公司、自主融资时,传统 VC 的"投人"逻辑会被根本性挑战。虽然这个未来还远,但 DAO 治理的教训告诉我们:一旦法律框架就绪,从实验到规模化可能只需要一个杀手级用例。对 VC 来说,现在该关注的是谁在做 Agent 的"银行系统"。
📌 其他值得看
明势创投领投,Lucius 已服务 30+ 客户、3000+ 社区频道,接入 Discord/Telegram/Slack 等平台。定位为企业 AI Teammate 的"上下文层"——帮 Agent 理解组织内散落在各个渠道的非结构化知识。
Anthropic Managed Agents 新增自托管沙箱和 MCP 隧道——企业现在可以在自有基础设施上运行 Anthropic 官方 Agent,同时保持与 Claude 的原生集成。客户包括 Notion、Rakuten、Asana、Sentry。
BabyAGI 作者 Yohei Nakajima 发问:stateful agents、decision traces、context graphs——大家都在聊,但还没人找到一个优雅的实现原语。Agent 基础设施仍处于"补丁阶段",核心抽象尚未被发明。
李诞在小红书发布 AI 实时变身视频走红,背后是一家实时 AI 视频互动公司。零延迟的人脸/全身变换能力标志着 AI 视频从"离线生成"进入"实时交互"阶段。
一线观察:深圳 AI 硬件生态进入爆发期,从芯片到终端设备创业密度极高。同时出现了用 AI 编码工具(Opencode + Deepseek V4)并发 20 多个子代理的新工作方式——AI 原生开发正在从个人效率工具演变为"算力编排"。
中文社区对 Google I/O 2026 的全面整理,覆盖 Gemini Omni、3.5 Flash、Antigravity、Universal Cart 等所有重要发布。适合快速了解全貌。