🔥 精选推荐
Meta 正在向美国员工电脑安装名为 Model Capability Initiative (MCI) 的追踪软件,捕捉鼠标移动、点击和按键数据,用于训练能自主执行工作任务的 AI agent。这是 Meta 构建自主工作 AI 的更广泛计划的一部分,将员工日常操作数据作为训练语料,目标是让 AI 复制人类的工作流程和决策模式。
🦐点评:这是大厂 AI 训练数据竞争进入"内部挖矿"阶段的标志性事件。Meta 的逻辑是:公开互联网数据已经被榨干,下一步的壁垒是企业内部的操作行为数据——这恰恰是 Anthropic、OpenAI 都缺的。如果 MCI 成功产出高质量的 agent 工作流数据,将直接威胁 UiPath、ServiceNow 等 RPA/企业自动化公司的核心价值主张。
Gary Marcus 拆解 METR 最新"时间跨度"图表引发的 AI 恐慌。METR 图表显示 Claude Mythos Preview 的 50% 成功率任务时间跨度已达 16 小时,但 Marcus 指出三个关键盲区:一是 50% 成功率远不等于可靠执行,80% 成功率版本的表现低得多;二是近期进步主要来自符号工具(代码解释器、验证框架)的集成而非模型本身的扩展;三是该图仅覆盖软件开发任务,不代表通用智能。Ramez Naam 的分析也显示 Mythos 在更广泛的 ECI 基准上并未显著超越趋势线。
🦐点评:Marcus 点出了 AI 投资中一个危险的认知偏差——市场用 50% 成功率的编码基准来推算通用 AGI 时间表,这和用婴儿体重翻倍速度预测成年体重一样荒谬。更值得注意的是他关于"符号工具贡献"的判断:如果 Mythos 的进步主要来自 harness 而非模型本身,那么 Anthropic 的真正护城河可能不是模型,而是 Claude Code 这层工具链——这对投资人评估 AI 公司的"模型 vs 产品"价值分配有直接影响。
Eric Ries 新书《Incorruptible》的核心论点:80% 的风险投资支持的创始人在 IPO 三年内被驱逐出公司。成功的公司不是死于竞争,而是死于"财务重力"——成功本身产生的短期利益压力。Ries 提出三种结构性防腐机制:公益公司(PBC)章程(只需两页 Delaware 文件)、信任型治理(以 Anthropic 的独立受托人为例)、基金会控股模式(Novo Nordisk 百年不变的示范)。核心洞察:"更难的路反而更容易"——越早做出有原则的艰难决定,越能积累结构完整性。
🦐点评:Ries 的数据(80% 创始人 IPO 后三年被换掉)对早期 VC 是个警示——你投的是人还是治理结构?Anthropic 被反复引用为"信任型治理"的标杆,这意味着其公司治理设计本身就是一种竞争优势:当 OpenAI 因 Altman 的治理危机动荡时,Anthropic 的受托人结构恰好证明了 Ries 的论点。对 VC 的操作启示是:在 term sheet 阶段就该推动 PBC 章程,而不是等到 IPO 前。
一个多 agent AI 系统解决 CNC 机加工车间的报价可行性分析:上传 STEP 文件后 30 秒生成完整可制造性报告,取代过去每张图纸 30-60 分钟的人工审查。系统由四个 agent 组成(工序分类、刀具匹配、可行性判断、报告生成),基于 Qwen 2.5 7B 在 AMD MI300X 上全本地运行。关键设计决策是数据主权:制造客户的 STEP 文件包含专有几何信息,发送到任何云端 API 都是保密违规,因此本地推理是业务刚需而非技术偏好。
🦐点评:这个案例精准展示了 AI 在传统制造业的落地路径——不是替代机械师,而是消除报价环节的人力瓶颈(每周 5-20 小时高级工时)。数据主权驱动本地推理的逻辑值得注意:航空、医疗器械等高保密制造业会天然排斥 API 模式,这给 AMD MI300X 和开源模型(Qwen 2.5)创造了一个 NVIDIA H100 + 闭源模型难以进入的垂直市场。
📌 其他新闻
智能庭院机器人公司长曜创新完成数千万元 A+ 轮融资,领投方为美的系盈峰环境,半年累计融资超亿元。公司聚焦无边界割草机器人,已拿下数亿元订单,目标构建庭院智能全生态系统。
光帆全感 AI 耳机(全球首款视觉感知 AI 耳机)将于 5 月 15 日开售,同时苹果正推进带摄像头的 AirPods 年内落地。AI 耳机从"听"到"看+听"的升级正在成为新硬件赛道焦点。
拉姆齐数 R(3,17) 的下界从 92 提升至 93,突破了 32 年未动的记录。AI 辅助纯数学研究的又一里程碑,从"验证已知结论"延伸到"发现新结果"。
Andrew Quinn 用 7MB 的有限状态转换器(FST)二进制文件替换了 3GB 的 SQLite 数据库,实现了极端的存储压缩比。展示了在特定查询模式下,传统数据库并非唯一选择。
泉果基金经理杜凡认为当前 AI 变革量级将超越此前的互联网浪潮,"仿佛正面对一堵陡然竖立的高墙,虽难以预判最终高度,但向上趋势清晰确定"。从算力基建到应用落地、半导体国产替代到先进制造,科技投资机遇正全面展开。
作者此前论证"许多反 AI 论点本质上是保守主义论点",本文进一步构建左翼立场支持 AI 的论据框架,认为反 AI 情绪部分源于加密货币泡沫和科技 CEO 政治倾向的时间巧合。
🧠 AI 技术前沿
Agent = Model + Harness:Claude Code、Cursor、Codex 底层模型可能完全相同,但表现不同。@addyosmani 认为关键在模型之上的"外壳"——提示词、工具、上下文策略、沙箱、子 agent、反馈回路等。裸模型不是 agent,只有外壳提供了状态和工具执行后才成为 agent。
查看推文 →
Delphi、C#、TypeScript 核心设计者 Anders Hejlsberg 谈 AI 与编程的未来:AI 永远不能取代程序员,而是加速器。AI 依赖编程语言/编译器/OS 等基础设施存在,擅长重复模式但不擅长创新,行业进步来自人类的"灵感闪现"。
查看推文 →
Google Gemini API 重大更新:从"自动贩卖机"式的 prompt-in/answer-out 变为结构化时间线,展示模型每一步(思考、搜索、工具调用、最终输出)。Google 正为运行中的模型"中途转向"(mid-flight steering)和异步工具调用做准备。
查看推文 →
BestBlogs 早报三大主题:Eric Ries 提出三种"不锈钢螺栓"防止公司腐化(PBC 章程、信任型治理、基金会控股);trigger.dev 联合创始人拆解持久化 Agent 的两条路(重放模型 vs 快照恢复);Mistral TTS 正复刻 LLM 的预训练→对齐→推理扩展路径,17ms 首包延迟是当前技术标杆。
查看推文 →
AI 研究的核心力量来自两个群体:在美国的中国研究者和在中国的中国研究者。
查看推文 →
🚀 创业动态
CodexBar 0.25 发布:新增 Manus、MiMo、Qwen、Doubao、Venice 等多个 AI 提供商,加入配额预警通知和堆叠式 Codex 账户切换器,通过 costs.new 加速成本历史查询。
查看推文 →
"Agent native apps will win." Agent 原生应用将胜出。
查看推文 →
TrustMRR 平台完成一笔收购:一位开发者两年前为给朋友庆生做了个 AI 音乐生成器,做到月收入约 100 美元后以 3000 美元出售。
查看推文 →
对比 2025 vs 2026 年 AI 一键生成网站的质量差异,展示一年内 AI 生成 UI 的显著进步。
查看推文 →
💬 观点与洞察
"只有硅谷人才懂 AI"的时代已经过去。AI 用户遍布每个行业,使用相同的模型。硅谷远不是最疯狂用例的中心——科学、法律、金融、教育领域的应用同样激进。
查看推文 →
Claude 的拟人化——名字(唯一用人类名字的 AI)、训练方式、Anthropic 哲学(Claude 宪法)、粉丝文化(Claude 漫画)——在中期会产生重大影响,无论好坏。
查看推文 →
Apple 可能正准备推出基于 2024 年愿景的新 Siri,但时间节点尴尬:Claude Code、Codex、OpenClaw 已经在做真正的助手该做的事——读邮件日历、主动发现问题、执行委托任务、语音交互。
查看推文 →
"Taste-washing"(品味粉饰)将成为热词。New Yorker 指出硅谷突然迷恋"品味"(TASTE)是因为 AI 威胁了工作和身份认同,所以 PR 策略变成兜售人类创造力和手艺,同时 AI 正在自动化它们。
查看推文 →
阿里内部研究:AI Native 时代组织形态将从以人为中心的 Org Chart 演变为 Execution Graph(人+AI Agent 协作图)。过去两千年组织围绕人的局限而建——遗忘、疲惫、误解、情绪——AI Agent 让这些前提开始松动。最小单元从"人+关系网"变为"任务+上下文+权限+工具"。
查看推文 →
Cursor 团队 Lee Robinson 的 11 条求职建议:简历一页、必须有 GitHub 和个人网站、LinkedIn 认真经营、简历要提 AI、定制投递而非海投。核心观点:90% 的人没有个人网站,做了就脱颖而出。
查看推文 →
🔥 精选推荐
Accenture 面临 AI 对其核心业务的结构性威胁,但自身无法先动手变革。全球 75% 的 Fortune 500 核心业务运行在 SAP 上,每次 SAP 迁移需要 60 名顾问耗时两年完成。Tessera(创始人 Kabir Nagrecha)正用 AI 将这个过程压缩到 6 人完成,直接切入 Accenture 最赚钱的系统集成业务。SAP 已宣布 2027 年停止支持旧版本,将触发全球数千亿美元的迁移需求浪潮。
🦐点评:这是 AI 对传统咨询业的精准外科手术——不是全面替代人,而是把最标准化、最高单价的业务(SAP 迁移)先自动化掉。Accenture 的困境在于:它的利润中心(按人头收费的长周期项目)恰恰是 AI 最容易吃掉的部分,而且 SAP 2027 停服倒计时会逼客户在"老方式 vs AI 方式"之间做选择。Tessera 如果能在 2027 窗口期前拿下标杆案例,有可能成为企业 AI 服务赛道的破局者。
不是 SaaS(软件即服务),而是"服务即软件"(Service as Software)。在中国市场,通用 Agent 产品按订阅收费很难跑出规模:AI 受众不够广、Pro-C 用户会自己用 Claude Code 魔改。真正能赚钱的路径是包装成"解决确定问题的服务外包"——不收月费,收 10 万元开发费加后续维护费。例如企业每月的会展物料生成,过去靠设计师手改,现在用 Agent 逐月自动生成打包交付。
🦐点评:这篇抓住了中国 AI 变现的核心矛盾——SaaS 的 PMF 天花板低(企业付费意愿弱),但"以 AI 为内核的外包服务"利润率远高于传统外包(6 人干 60 人的活)。对 VC 的启示是:在中国投 AI,别投"工具"投"服务商"。这和 Tessera 切 Accenture 的逻辑完全一致:换皮不换壳,把 AI 能力包装成客户习惯买单的交付形式。
Dan Farrelly 画了一条 Agent 技术演进时间线:从 RAG+向量数据库,到 ReAct 工具调用,到上下文窗口扩大后虚拟记忆需求减弱,到 Anthropic 博客推动的编排模式,再到子 Agent、MCP、CLI 和沙箱,现在进入后台 Agent 阶段。每个节点都有人宣称"这才是正确方式",但六个月后就被下一个范式取代。核心建议:模型调用层绝对不能耦合进业务逻辑,保持松耦合才能在范式切换时不用重写整个系统。
🦐点评:这条时间线对 AI infra 投资人是一面镜子——过去两年我们经历了向量数据库热(Pinecone/Weaviate)、RAG 工具热、MCP 协议热,每一波都有公司拿到融资,但赢家不断换人。Dan 的"不耦合模型调用层"原则暗示:真正的基础设施赢家不是绑定某个范式的公司,而是像 Inngest 这样做"范式无关的编排层"的玩家——这正是 trigger.dev 和 Temporal 争夺的领域。
📌 其他值得看
英伟达 GEAR Lab 负责人 Jim Fan 在 Sequoia AI Ascent 上宣布 VLA(视觉-语言-动作)路线过时,新范式叫世界动作模型(WAM),代表作 DreamZero(140 亿参数),用视频世界模型替代遥操作数据,目标 2040 年前让机器人自主设计制造下一代自己。
作者所在公司有一份 8000 人裁员名单,自己有 10% 概率在名单上。从 Coinbase 的"AI 裁员"出发,探讨当前裁员潮的本质:企业高层真正困惑的不是 AI 技术,而是如何在 AI 投入和 ROI 之间找到合理的商业逻辑。
YC CEO Garry Tan 五个月前重新变成"建设者":用 AI 搭建了每天执行超过 100 个定时任务的自动化系统。他称之为"元元提示法"(meta-meta-prompting),核心是让 AI 不只是执行工具,而是一个在他睡觉时仍在运转的系统。