🔥 精选推荐

Anthropic 发布 Claude 计算机控制功能的 research preview,Claude Cowork 和 Claude Code 中用户可让 Claude 直接操作桌面——包括点击、滚动、打开浏览器和开发工具,无需额外配置。系统会优先使用精确工具(如 Slack、Google Calendar 连接器),仅在没有连接器时才调用鼠标键盘。同步推出的 Dispatch 功能允许用户从手机下发任务,Claude 在电脑端完成后交付成果。目前面向 Pro 和 Max 订阅用户开放,内置了 prompt injection 检测等安全防护,部分应用默认被屏蔽。
🦐点评:Computer use 不是新概念,但 Dispatch 才是真正的产品洞察——把"手机下指令、电脑执行"这个工作流闭环做出来了。这意味着 Anthropic 开始从"最好的模型"向"最好的 Agent 体验"转型,直接跟 OpenAI 的 Superapp 战略正面对撞。对 VC 来说,这暗示着 Agent 的竞争正从模型层上移到体验层,中间件和工具层的窗口期在收窄。
claude.com
Stripe 工程师 Steve Kaliski 介绍了内部 AI 编码代理"minions"的工作方式:工程师在 Slack 中点击 emoji 即可触发代理,代理利用 Stripe 内部所有工具一键生成 PR,目前每周产出约 1,300 个无需人工辅助(仅需 code review)的 PR。核心基础设施是云端隔离开发环境,使多个代理可并行修改代码。非工程师也开始使用 minions 来提交代码。此外还演示了 machine-to-machine 支付协议,AI 代理可自主调用第三方服务完成任务(如用 5.47 美元策划生日派对)。
🦐点评:1,300 PRs/周这个数字本身不惊人——惊人的是 Stripe 把 Agent 的触发点放在了 Slack emoji。这说明真正的 AI 编码加速不靠"更强的模型",而是靠"更低的调用门槛"。machine-to-machine 支付更值得关注:如果 Agent 可以自主花钱调用服务,支付基础设施就成了 Agent 经济的 picks-and-shovels,Stripe 在给自己铸造护城河。
lennysnewsletter.com
Latent Space 本期 AINews 聚焦几个重要信号:OpenAI 关停 Sora(视频生成首个重大产品死亡案例)、LiteLLM 遭遇供应链攻击(恶意包在 PyPI 上存活 46 分钟、被下载 47,000 次)、以及 App Store 因 vibe-coded 应用泛滥面临分发模式危机。核心图表显示 App Store 新应用提交量激增,Apple 开始封禁 Replit、Vibecode 等工具类应用。文章认为"War on Slop"是 2026 年关键主题——传统应用分发平台正被低成本 AI 生成应用冲击。
🦐点评:三条消息看似独立,实则指向同一个结论:AI 基础设施正在经历第一轮"质量清洗"。Sora 死于算力 ROI 不达标,LiteLLM 暴露了 Python AI 生态的脆弱性,App Store 则面临"人人可造 app"带来的审核失控。对投资人来说,2026 下半年的主题不是"AI 能做什么",而是"谁来筛选 AI 做出来的东西"——内容审核、代码安全、应用质量保障这些赛道的需求拐点可能到了。
latent.space
Arm 宣布将直接销售自研 CPU,而非仅授权 IP。Ben Thompson 分析了这一战略转变的动因:随着计算从通用走向异构、从芯片走向系统,Arm 的传统授权模式面临价值被稀释的风险。直接卖芯片让 Arm 能捕获更多系统级价值,但也意味着与自己的客户(高通、联发科等)产生直接竞争。
🦐点评:Arm 从 IP 授权到卖芯片,本质是"平台 vs 产品"的经典困境——Intel 做了反向选择(从产品退回平台代工),Arm 现在走了相反的路。短期看,SoftBank 需要 IPO 后的增长叙事;长期看,AI 推理芯片市场的碎片化给了 Arm 一个"既当裁判又当运动员"的窗口。高通和联发科的反应将决定这是一步妙棋还是昏招。
stratechery.com
a16z 的 Jacob Zietek 认为机器人行业的部署瓶颈不是技术而是人才结构。当前领域过度优化于研究型人才(追求论文和新颖性),缺少关注可靠性、客户和运营的工程化人才。他指出 VLA(视觉-语言-动作模型)和低成本硬件已经让部署变得可行,但行业文化仍停留在实验室阶段。核心论点是机器人领域需要"更少的每人均机器人学家"——不是减少总人数,而是引入更多运营、产品、销售人才。
🦐点评:这篇文章最尖锐的判断是"优化新颖性赚声誉,优化可靠性赚收入,二者几乎从不同时优化"。过去三年 VC 投机器人大多投的是"研究团队 + 硬件原型",但真正能跑出来的公能是那些 Day 1 就有运营 DNA 的团队。a16z 发这篇可能不只是观点输出——更像是在给自己的 deal sourcing 标准做市场教育。
a16z.news

📌 其他新闻

Google 发布 Lyria 3 和 Lyria 3 Pro 音乐生成模型,开发者可通过 Gemini API 使用。Pro 版本支持生成最长 3 分钟的完整歌曲,包含人声、前奏、主歌、副歌等结构,支持节拍控制和多语言歌词。Clip 版本面向快速原型和社交媒体素材。
blog.google
OpenAI 宣布关停 Sora 应用和 API,包括 ChatGPT 内的视频生成功能。官方口径是算力需求增长需要做取舍,研究团队将转向世界模拟和机器人方向。迪士尼同步退出合作,其 10 亿美元投资(全部为认股权证)从未完成资金交割。
x.com
OpenAI 计划将 ChatGPT、Codex 编码平台和浏览器统一为桌面"超级应用",由应用负责人 Fidji Simo 主导,精简产品线聚焦企业客户。
wsj.com
Newcomer 独家获取 Bessemer 印度业务数据:从全球基金累计投入印度 7.74 亿美元,已返还 6.83 亿美元现金(含持有总值 16 亿美元),DPI 显著优于 Sequoia India 和 Accel India,但错过了一些大赢家,IRR 落后。
newcomer.co
LiteLLM 遭遇 PyPI 供应链攻击,恶意包在上线 46 分钟内被下载约 47,000 次。Simon Willison 引用分析指出,这暴露了 Python AI 生态对关键依赖的脆弱性。
simonwillison.net
a16z 领投 Glimpse 的 A 轮融资。Glimpse 用 AI 解决消费品牌的零售扣款(deductions)问题,已服务超过 200 个品牌,帮助十亿美元级企业找回数百万美元流失收入。三位 Purdue 校友创办,经历了从 YC 后的艰难转型。
a16z.news
Pi agent 框架(OpenClaw 底层)创建者 Mario Zechner 发文批评当前 Agent 工程的纪律丧失——开发者沉迷于产出最大量代码,而非高质量代码。Simon Willison 转发并表示认同。
simonwillison.net
作者用 16 小时手写一份设计文档,同时用 Claude Opus 4.6 和 GPT-5.4 各生成一份。AI 版本几分钟完成。文章对比三份文档的质量差异,探讨 AI 对技术写作的影响。
refactoringenglish.com
雷锋网独家报道,吾云创新正接近完成一轮大额融资。上轮由星连资本(智谱背景)领投超亿元,专注于为 AI 工作环境打造新一代设备。OpenClaw 热潮下市场态度急剧转变,此前多数投资人认为"太超前"。
雷锋网
DeepSeek 大规模招聘 Agent 方向人才,发布 17 个岗位,明确"重度 Vibe Coding 优先"。信号显示 DeepSeek 正从基础模型研究向 Agent 产品化倾斜。
量子位

🧠 AI 技术前沿

karpathy @karpathy
LLM 个性化记忆的共性问题:两个月前随口问过的一个话题会被当成"深度兴趣"反复提及,所有模型都有这个毛病。推测原因是训练时上下文内容大多与任务相关,模型产生了"凡是给到的信息都要用上"的偏差。
查看推文 →
Hesamation @Hesamation
ARC-AGI-3 发布,奖金 70 万美元。Opus 4.6 在 ARC-2 高难度模式得分 69.2%,在 ARC-3 最高难度仅得 0.2%。该基准测试目标是评估"探索新环境、动态获取目标、构建可适应的世界模型"等能力。
查看推文 →
emollick @emollick
ARC-AGI-3 需要多次尝试但对人类来说是可解的,好奇前沿模型的低分有多少来自 harness/视觉/工具限制,多少是 LLM 本身的能力瓶颈。
查看推文 →
emollick @emollick
很多人以为 AI 能做某个任务就能替代人类,但 token 成本并不低——对许多任务(包括技术活)而言,人类仍然比 AI 便宜得多。算力效率提升和供给增加会改变这个等式,但现阶段 AI 并非万能替代方案。
查看推文 →
steipete @steipete
OpenClaw 新 beta 版本发布,改进了 MS Teams 集成和 OpenWebUI 支持。
查看推文 →

🚀 创业动态

emollick @emollick
试用了 Google Lyria 3 Pro 音乐 AI,效果很好。用里尔克的《第一哀歌》让 AI 改编成"90 年代男团风格",居然相当洗脑。AI 能理解并执行这种跨领域风格混搭令人惊讶。
查看推文 →
gregisenberg @gregisenberg
Microsoft Teams 成为企业聊天第一工具,本身就证明了"分发几乎就是一切"。
查看推文 →
marclou @marclou
QStash 的后台界面太烂,直接 vibe code 了自己的 UI 来定位流量峰值。预测未来大多数 SaaS 将只暴露 API,UI 由 AI 按需为每个用户定制生成。
查看推文 →
levelsio @levelsio
讨厌你的客户永远不是创业的好起点。
查看推文 →

💬 观点与洞察

Hesamation @Hesamation
AI 在 ARC-AGI-3 上与人类的巨大差距揭示两个事实:1)我们离 AGI 还很远;2)基准测试会饱和,别太当真。
查看推文 →
emollick @emollick
AI 生成的垃圾科学帖子持续影响市场,这次是通过误读或误标论文日期。科幻小说,但是那种蠢的。
查看推文 →
emollick @emollick
Sora 关停引发回忆:最受欢迎的 Sora 视频是"所有人戴活鸭帽子的摄政时代浪漫剧"。不太理解 OpenAI 为什么觉得算力有更有价值的用途,真是个谜。
查看推文 →
Hesamation @Hesamation
AI 编码中最被忽视的问题之一:你的 rules 和 markdown 配置文件会随时间变成"意大利面条式混乱",腐蚀 Claude 的上下文质量。不清理的话,整个开发体验都会劣化。
查看推文 →
EXM7777 @EXM7777
声称自己即将用 Claude Code 搭建一套"比 OpenClaw 强 10 倍"的系统,只差 mission control 部分还没完成。
查看推文 →

🔥 精选推荐

晚点独家报道,今年春节以来火山引擎豆包大模型日均调用量已超 100 万亿 Tokens,不到两个月涨超 60%。全球目前仅 OpenAI、Google 和字节跳动三家达到这一量级。Agent 产品(尤其是编程 Agent 和 OpenClaw)推动了 Token 消耗的爆发式增长。黄仁勋在 GTC 上称 Token 将成为数字世界最核心的大宗商品。阿里成立 Token Hub 事业群由吴泳铭亲自带队,目标拿下中国 AI 云增量的 80%。火山引擎此前定下 2026 年 MaaS 收入超百亿元目标,已两度上调。
🦐点评:100 万亿 Tokens/天这个数字背后最值得关注的不是规模,而是增长结构——个人用户 Token 消耗"近期明显增长"意味着 C 端 Agent 开始真正跑起来了。火山引擎的战略很清晰:用低价模型 API 做入口,拉动 IaaS/PaaS 整体消费,本质上是 Azure+OpenAI 模式的中国翻版。但字节的独特优势在于自有 C 端流量(抖音生态),这让它的 Token 增长不依赖外部开发者生态,天花板更高。
晚点LatePost
Momenta 已向港交所秘密递交招股书,IPO 估值预期超千亿元,计划 2026 年内挂牌。累计搭载车辆近 70 万辆,获超 170 款车型定点,智驾方案已出海至 10 余国。投资方阵容包括上汽、丰田、戴姆勒、通用、博世等。创始人曹旭东为清华物理出身,此前在商汤任研发总监。多家国产智驾供应商也在准备今年上市。
🦐点评:Momenta 千亿估值上市的时间点很微妙——它选择在 L4 级 Robotaxi 公司(小马、文远)已上市但表现一般的窗口期进场,用"量产智驾供应商"的故事做差异化。70 万辆搭载量和 170+ 车型定点是实打实的壁垒,但港股投资人更关心的是毛利率和客户集中度。如果上汽系占比过高,估值可能承压。
晚点LatePost
完整梳理了 Sora 从 2024 年 2 月预览到 2026 年 3 月关停的完整时间线。关键数据:Sora App 生命周期应用内购收入仅约 210 万美元,峰值月下载 330 万次跌至 113 万。迪士尼的 10 亿美元投资(全部为认股权证,零现金)从未完成资金交割。Tyler Perry 因 Sora 暂停了 8 亿美元影视基地扩建,如今看来是一个正确的等待。
🦐点评:210 万美元的生命周期收入对 OpenAI 来说约等于零——Sora 的真正代价不是产品失败,而是消耗了宝贵的算力和工程资源在一条非核心赛道上。迪士尼的"零现金认股权证"交易结构现在看来是非常精明的对冲:它用 IP 换期权而不是砸钱,关停了也没有实际损失。这给 VC 的启示是:跟 AI 大厂合作要学迪士尼的结构设计,别学那些真金白银 all in 的。
赛博禅心

📌 其他值得看

AWS 开发 AI 助手承接被裁技术专员的工作,帮销售快速回答技术问题,还推出了自动协调合作伙伴交易的 Agent。CEO 贾西去年已预告 AI 会逐步减少员工数量,亚马逊还计划到 2033 年用机器人替代数十万岗位。
Z Potentials
AI 视频编辑应用 Captions 更名 Mirage,定位 AI 实验室。过去 365 天下载超 320 万次,应用内购收入 2840 万美元,已创建超 2 亿个视频。计划拓展亚洲市场。
Z Potentials
a16z Growth 团队 Alex Immerman 的深度访谈,谈及 Waymo、ElevenLabs、Kalshi 等公司投资逻辑,以及 AI 时代成长型投资的判断标准——最被低估的公司是 Flock Safety(每天协助侦破 2,800 起案件)。
Z Potentials
基于 TrueUp 数据的分析:PM 岗位达三年新高(7,300+),工程师岗位 67,000+,AI 岗位呈曲棍球棒式爆发,但设计岗位停滞。三分之一 AI 岗位集中在湾区,远程机会持续缩水。
宝玉AI
Web Access skill 为 Agent(OpenClaw、Claude Code 等)提供通用联网+浏览器能力,开源 2 天不到获 1000 Star。支持需登录站点的调研、社媒平台自动填写、自动化测试等场景,可同时操作 100+ 网站。
一泽Eze