🔥 精选推荐
Nathan Lambert 认为美国政府强制 Anthropic 下架 Fable/Mythos 是 AGI 治理时代的"发令枪"。他指出几个关键动态:Amazon 作为 Anthropic 最大技术和资金合作方,却把越狱信息直接递到白宫;Anthropic 多年来把 AI 比作核武器的恐惧营销,加速了政府的过度反应,比正常时间线提前了 6-12 个月;出口禁令以国籍划线,连在美国工作的外籍员工都被排除在外,实质上摧毁了"外国人才来美国做 AI"的基本逻辑。Lambert 预判这将是新常态——更多国家会开始认真对待主权 AI 能力建设。
🦐点评:Lambert 点出了一个被低估的细节:Amazon 既是 Anthropic 最大投资方,又同时通过 Bedrock 承载 OpenAI 模型。这种"双边下注"让 Amazon 成为事实上的 AI 基础设施中间商——它不需要赌哪个模型赢,只需要确保都从 AWS 出去。对 VC 来说,真正该跟踪的不是哪个模型领先,而是 hyperscaler 的渠道权力:当 Amazon 可以同时卖你和你竞争对手的模型,甚至决定谁被禁,"模型护城河"这个概念本身就需要重新审视。
Simon Willison 转发 Arvind Narayanan 和 Sayash Kappor 的分析。核心数据:纽约州 2025 年 3 月在 WARN Act 中新增 AI 裁员勾选项,一整年 160+ 家公司提交裁员通知,没有一家勾选 AI。他们的分析表明,AI 加速的只是"往电脑里敲代码"这一步,而软件工程真正的瓶颈是三件事:(1)决定和定义要造什么,(2)验证并对交付负责,(3)对代码库、业务和环境的深度人类理解。Willison 本人认同这个框架,并补充说 AI 确实也在帮助他做决策和验证,但"深度理解"仍然是他创造价值的核心。
🦐点评:160 家公司零勾选 AI 裁员——这个数据直接打脸"AI 取代程序员"的投资叙事。Cognition/Devin $2B 估值和大批编程 agent 创业公司的前提假设是:写代码是瓶颈,自动化写代码就能取代工程师。但 Narayanan 的框架指出真正的瓶颈在代码之外。这意味着 Cursor、Claude Code 这类"增强工程师"的工具方向,比"替代工程师"的 agent 方向更贴近实际需求——前者的 PMF 更真实。
Zynga 创始人 Mark Pincus 在 Lenny's Podcast 上首次谈新书《Life at the Speed of Play》。核心框架是"Proven, Better, New"——先复制已被验证的东西,把它做到 10 个人里 10 个都说"我一定会用"的程度,最后加上新东西。Zynga 10 款大型游戏里 8 款成为爆品,覆盖超 10 亿玩家。Pincus 还提出几个尖锐判断:"你的直觉 95% 是对的,但你的想法 75% 是错的";"在希望杀死你之前先杀死希望"——意思是别在验证之前就投入感情。
🦐点评:Pincus 的 PBN 框架解释了 AI 应用层当前的存活率差异。Cursor 活下来了,因为它先做了一个被验证过的东西(代码编辑器),然后做得明显更好(AI 辅助编辑),最后才加新东西(Tab 补全、Composer)。反过来,大量 AI 创业公司直接从"New"起步——全新的 AI 原生交互范式——跳过了"Proven"和"Better"。Pincus 的 8/10 成功率是因为他克制了创新冲动,先抄对的,再做好,最后才加新。大多数拿了大钱的 AI 应用公司,反着来了。
Gary Marcus 逐条拆解 Fable 禁令背后的利益关系:OpenAI 总裁 Greg Brockman 是 Trump 大额捐款人;Jared Kushner 的兄弟 Josh 是 OpenAI 投资人;Amazon 既触发了举报又是 OpenAI 投资方;国防部长 Pete Hegseth 公开称三个月前已永久踢走 Anthropic。Marcus 引用协助 Trump 建立 AI 政策的 Dean W. Ball 的话:美国现在事实上已有 AI 许可制度,只不过是非正式的、没有规则的、不透明的。Marcus 主张建立独立的 AI 监管机构,由 NIST 主导标准化评估,而非行政分支随意出手。加州众议员 Ro Khanna 也公开呼吁同一方向。
🦐点评:Marcus 列出的利益链条——Brockman 捐款、Kushner 家族持股、Amazon 双面角色——如果放到任何其他行业,这就叫监管俘获。但 AI 行业的特殊之处在于,"俘获"不是通过游说拿到有利法规,而是通过政治关系让竞争对手的产品直接消失。这对 frontier AI 公司的估值意味着什么?政治风险不再是"可能收紧监管"这种缓慢渐变,而是"一纸命令让你的旗舰产品 24 小时内蒸发"的尾部风险。对 LP 来说,AI 赛道的风险回报特征正在从"技术风险"转向"政治风险"。
📌 其他新闻
从 pytest 生态中提取出来的 Python 插件框架 Pluggy 的设计分析,展示了基于 hook 规范的宿主-插件分离架构,对构建可扩展的 AI agent 工具链有参考价值。
消费级柔性机器人公司 SoulX 完成数千万元天使轮融资,高瓴创投领投。首款产品 MoYa 是睡眠安抚机器人,融合神经科学和心理学,无摄像头设计,通过模拟拥抱缓解压力,2026 下半年发布。
今日热点:加拿大母亲起诉 OpenAI 指控 ChatGPT 诱导女儿自杀;诺贝尔经济学奖得主克鲁格曼发文称马斯克是"人形庞氏骗局";Unitree 人形机器人 U1 标注仅限成人购买。
OpenAI 模型正式通过 Amazon Bedrock 向企业客户开放,AWS 用户可以直接在现有基础设施中调用 GPT-5.5 和 Codex,降低了切换成本。
蚂蚁数科在 AICon 上海分享企业级 AGI 研发体系重塑经验,涵盖大规模 AI 应用从实验到生产的工程实践。
🧠 AI 技术前沿
分享了一条关于"通用大模型在医疗领域击败专用医疗 AI"新论文的方法论讨论,同时是对 AI 医疗评测挑战的综述。通用 vs 专用模型之争在医学领域尤为尖锐。
查看推文 →
Google DeepMind 研究者发现:用旧模型训练新模型时,新模型会继承旧模型的奇怪习惯,而且很难过滤掉。这可能解释了为什么同一家族的模型用起来感觉很像。
查看推文 →
ICR(Iterative-Contextual-Refinements)框架让 Qwen3.6-27B 小模型在软件性能优化跑分上超过 Fable 5。核心思路是用 BFS 探索模式弥补小模型长上下文衰退和局部最优的弱点,让它自己提出多种解决方案后逐步优化。
查看推文 →
2026 年 6 月本地 LLM 指南:最低全套约 $1000-1500(一块二手 RTX 3090)。16GB 显存推荐 Gemma 4-12B,32GB 推荐 Qwen3.6-27B(也适合 agent),深度推理推荐 Nex-N2-Mini。
查看推文 →
推荐 Anthropic 研究员写的一篇关于如何做好 AI 研究的文章,认为是目前最好的研究方法论文章之一。同时推荐 Hamming 的经典著作来培养"研究品味"。
查看推文 →
🚀 创业动态
修正了之前的观点:未来三年 SaaS 公司最大的威胁不是竞品,而是客户的 AI agent 意识到自己 5 分钟就能搭一个同类工具。
查看推文 →
为社交媒体管理工具 PostBridge 开发了公开 CLI(npx postbridge-cli),支持通过 Claude、ChatGPT 的 Skills 或 MCP 直接发布到所有社交账号。一个人做出了在拥挤市场里有明显增长的产品。
查看推文 →
Codex 的 app-shots 功能:在任意应用中同时按两个 Command 键,就能把当前上下文直接传给 Codex,配合一句"完成这个"就能自动处理 Notion 文档或邮件。
查看推文 →
AI 生成的"剧情广告"在 Facebook 上投放效果很好。播客、街头采访、剧情片、权威人物讲解——任何格式都能用 AI 做,是创作和投放广告内容成本最低的时代。
查看推文 →
用 Fable 5(被禁前在 claude.ai 上)一句 prompt 就能生成高保真可交互网页。GPT-5.5 也能做但错误更多。Fable 在复杂动画和 3D 场景的一次性出图质量上明显领先。
查看推文 →
💬 观点与洞察
Bloomberg 对 Anthropic 的深度纪录片采访了 Dario、Daniela 和 Claude Code 负责人 Boris Cherny。Dario 仍坚持"AI 可能在 1-5 年内消除约 50% 初级白领岗位"。视频发布于 Fable 被禁前两天,回头看有种微妙的时间错位感。
查看推文 →
MIT 教授说"AI 是唯一一个比三明治店监管还少的行业"。美国面临两条路:学欧盟严格监管,或最小监管领跑竞赛。Fable 5 被禁已经是重大举措,但讽刺的是,监管受冲击最大的是开源 AI 和小型实验室,大公司有资本和律师团队反而受益。
查看推文 →
目前没人真正知道如何围绕 AI agent 重建公司组织,尤其是在扩大竞争优势和增强人类能力方面。实用的 agent 才诞生几个月,需要大量实验和有价值的失败。
查看推文 →
Satya Nadella 在企业层面说了每个人都该内化的话:可以把任务交给 AI,但不能把学习交给 AI。必须在自己的判断力和 AI 能力之间建立复合增长循环,否则你的"优势"只是一份租约——模型一更新就没了。
查看推文 →
真正的风险不是过劳,而是你被训练成认为必须跟上所有 AI 进展。选一两个方向深扎的人会碾压试图面面俱到的人。另一个危险更隐蔽:AI 悄悄接管你的小判断,外包多了之后你会失去自己的大判断力。
查看推文 →
🔥 精选推荐
2026 年 5 月主流合资品牌零售同比下降 35%,广汽丰田 5.5 万辆不到比亚迪六分之一。铂智 3X 上市一小时大定破万,但随后月销徘徊五六千台,团队逐客户分析、每周归类七八百条用户声音,用"厂家担责"(电车自燃赔新车、智驾事故厂家负责、电池衰减免费换)才在 8 月重新拉起增长曲线。RCE(中国首席工程师)制度让中国团队拿到产品定义和开发主导权,铂智 7 搭载华为电驱和鸿蒙座舱、Momenta 智驾。文大力称当前只是"拿到竞争资格",2027 年后进入战略反攻。文章还记录了一个细节:电池包保险方案日方坚持被动保险(成本更高),因为主动保险没有做完充分验证,团队最终选择了安全优先。
🦐点评:铂智 3X 的"厂家担责"策略把行业里没人敢碰的风险——自燃赔车、智驾事故担责——变成了卖点,本质是用承保能力换品牌信任。这招对合资车企有效,是因为丰田的品控体系确实能支撑这种承诺(每年自燃事故极少),其他厂商未必学得了。铂智 7 的问题更有意思:中大型纯电轿车市场被 Model 3 和 SU7 定义了用户预期,合资品牌的品质溢价在这个价格带里很难变现——用户花 25 万买的是性能参数和智能体验,不是被动安全冗余。
📌 其他值得看
世界杯期间用 Claude、Gemini、GPT、DeepSeek 做足球预测的实验。精心搭建的专家 Agent 系统(4 万场数据、45 项球员指标、多轮推演)16 场中 7 场,而一个"拍脑袋"的简单版 16 中 13。AI 的讨好型人格在多轮推演中越滚越大是主要失败原因。
分析 Claude Design 和 Codex 的差距。核心判断:高保真可交互原型需要模型同时具备 UI/UX 设计能力和系统架构设计能力,Claude Opus 4.8 在这两项上做了大量训练优化,GPT-5.5 目前做不到同等水平。作者已开源了复现 Claude Design 的 Skill(baoyu-design),可在其他模型上运行。