🔥 精选推荐
诺贝尔化学奖得主、AlphaFold 之父 John Jumper 宣布离开效力近九年的 Google DeepMind,加入直接对手 Anthropic,DeepMind 负责人 Hassabis 第一时间致谢。就在两天前,Transformer 核心作者 Noam Shazeer 也离开 DeepMind 投奔 OpenAI——48 小时内 Google AI 连失两员大将。Jumper 离职时头衔为工程院士(VP, Engineering Fellow),本人未给出原因;Bloomberg 称他近来已深度参与 Google 的 AI 编程开发团队。
🦐点评:Anthropic 把一位诺奖级科学家从竞对核心挖走,信号不是"补人",而是它已有足够现金流和叙事去打顶级人才争夺战——上一个能从 DeepMind 系统性抽血的只有 OpenAI。两天内 Jumper 去 Anthropic、Shazeer 去 OpenAI,Google 在 Gemini 3.5 还未拿出决定性答卷时连丢蛋白质和 Transformer 两条命脉的旗手,人才流向比 benchmark 更能预测三家未来两年的相对位置。
英伟达联合 CMU、Berkeley 推出具身智能 Autoresearch 框架 ENPIRE:让 8 个 Coding Agent 各自控制一台双臂机器人,自主读论文、改算法、训练策略、部署实验、分析结果并迭代,全程无人值守。其核心是一套 Harness Framework,把现实世界里最棘手的"自动复位 + 自动评分 + 安全边界"固化为标准 API,让真实环境第一次变成可反复调用的研究台。最具代表性的 Pin Insertion 任务中,机器人 3 小时内把 4 毫米孔洞插针成功率从 0 拉到 99%,GEAR 负责人 Jim Fan 称实验室"已经在彻夜自我改进"。
🦐点评:真正值钱的不是又一个 RL 策略,而是"现实世界的 env.reset()"——谁能把物理实验的复位与评分自动化为 API,谁就把具身智能的迭代速度从人力受限变成 token 受限。英伟达把这套基础设施做成标准接口,等于在卖具身研究的"水电煤",比单点卖机器人更接近其 GPU 生意的逻辑;对投机器人本体的基金是个提醒:壁垒可能正从硬件向自动化研究 harness 转移。
📌 其他新闻
菲尔兹奖得主陶哲轩 2014 年预言的"大规模数学协作、计算机自动验证证明、形式化语言取代 LaTeX"正被 AI 逐一兑现;他主导的 Equational Theories 项目用"AI+人类协作"在 48 小时内攻克 2200 万个数学问题中的大半,很多环节已无需他亲自插手。
Latent Space 当日 roundup 直言这是平静的一天,主要内容是为 AIE WF 2026 大会做最后一轮推广;同时指出 GLM 5.2 仍在强势霸榜,呼应了当天 X 上的开源模型热度。
Claude Code 例行小版本:流式卡顿提示文案改为"Waiting for API response · will retry in …",并把触发等待提示的静默时长从 10 秒放宽到 20 秒,减少正常响应延迟时的误报。
作者借《黑客帝国》Neo "上传"功夫的桥段,讨论"信息即时可得 ≠ 真正掌握技能"——在 AI 把知识获取成本压到极低的时代,电影刻意跳过的"练习"环节恰恰是人区别于机器的关键。
延续此前用 LLM 生成解题代码的实验,作者这次让 Claude 生成 Z3/Python 代码求解 6×5 棋盘摆放所有棋子的约束问题,记录了用 SMT 求解器替代 Prolog 的效果差异。
本周包管理动态:sbt 2.0.0 全面转向 Scala 3、要求 JDK 17 并换用 Bazel 兼容缓存层;pnpm 11.7 新增只读 store 索引以支持 Nix store / OCI 层安装,并加入批量发布与按 scope 鉴权。
Cory Doctorow 借本周泄露的、与 Peter Thiel 相关的神秘社团 Dialog 的成员名单与细节,剖析硅谷权贵阶层的"招募"逻辑与封闭精英网络的运作方式。
Brian Potter 的每周基建与工业技术清单:涵盖新住房法案、通用汽车进军电网级储能、对数据中心建设延期的质疑,以及固态空调等前沿话题(大部分内容需付费订阅)。
🧠 AI 技术前沿
GLM 5.2 可能是本地 AI 的"ChatGPT 时刻":100 万 token 上下文能装下整个代码库,目前编码能力最强的开源模型,MIT 协议零限制,可在 Ollama/LM Studio 本地跑,体感接近 Opus 4.8,他判断 2027 是本地 AI 之年。
查看推文 →
GLM 5.2 + OpenCode 几乎追平 Codex / Claude Code;他认为 Anthropic 和 OpenAI 无法撤掉订阅补贴,否则开源模型的低价会碾压它们,而用户随时能切到开源模型且智能损失不大。
查看推文 →
用同一个 prompt(纯 HTML canvas 模拟旋转的土耳其烤肉串)对比,GLM 5.2 完美还原了物理模拟,GPT OSS 120B 只是尽力而为,凸显开源模型在代码生成上的差距。
查看推文 →
唱反调:GLM-5.2 并不是个好模型,凡是夸它好的人都是在看 benchmark 跑分卡,而不是在真实 agent 循环里跑过它。
查看推文 →
如果 AI 自我改进哪怕以非常有限的方式成立,那么模型与产品/harness 的迭代节奏都应加快;这正发生在 Anthropic 和 OpenAI,但去年看似在追赶的其他实验室都没出现这种加速。
查看推文 →
分享论文 S-Agent:通过空间工具使用激发推理,以提升模型的空间智能能力。
查看推文 →
🚀 创业动态
用 GPT 5.5 一次性 vibe coding 出一个通用 agent 的 iOS app,其底层 agent 由 GLM 5.2 驱动并具备完整 vibe coding 能力。
查看推文 →
trust mrr 上完成第 104 笔创业收购:一个做"AI 网红/AI influencer"的 AI 创业项目仅以 2000 美元卖出,侧面反映这类生成式内容工具的低门槛与同质化。
查看推文 →
推荐 LangChain 官方大使出品的「Deep Agents 实战」开源教程,核心是 Agent 开发的三层架构(Runtime=LangGraph / Framework=LangChain / Harness=Deep Agents),并用虚拟文件系统做上下文工程。
查看推文 →
分享如何用一段超长 prompt 让 ChatGPT 适配并生成细节极其丰富的 landing page 的具体做法,附可复制的模板。
查看推文 →
不理解为何有人在意 X 的收入分成:能拿到 200 美元分成的曝光量,靠自己的产品+赞助贴轻松月入过万,分成无论怎么看都微不足道。
查看推文 →
当下最值钱的技能组合:会正确搭建与管理 agent、能跑本地模型的人;懂分发的营销人;能造硬件+接 AI+搞供应链的机器人工程师;会做短视频的策展人;以及能同时造产品又能把它推到人前的"建造者-分发者"。
查看推文 →
💬 观点与洞察
BestBlogs 06-21 早报:李飞飞提出"哑铃效应"——文本智能成本归零后,劳动力两极分化为不可复制的顶尖工匠与能调度 AI 的高能动性通才,中间地带坍缩;另一篇指出 Agentic coding 真实成本是普通问答的千倍,七成消耗在试错,Uber/Amazon/微软已相继收紧 Claude Code 预算。
查看推文 →
真正的 AI 危机已从"AI 抢工作"变成 AI 领袖在搞砸社会契约:用恐惧营销 AI、试图独占技术、替大众规划未来而非赢得信任——信任才是最大的问题。
查看推文 →
AI 总体上是个糟糕的小说作者,但对某一类(隐喻丰富、短句顿挫、篇幅短、情节轻的)文体写得极好——而这恰好是能在现代文学短篇小说比赛中拿奖的风格。
查看推文 →
AI 之后显然是长寿(Longevity):现在的 Bryan Johnson 相比他 10 年、50 年乃至 250 年后的影响力,只是个微影响者。
查看推文 →
🔥 精选推荐
系统拆解 Claude Code 的七种上下文注入机制——CLAUDE.md、Rules、Skills、Subagents、Hooks、Output Styles、System Prompt Append,核心判别维度是"何时加载、压缩后是否保留、占多少 token"。文章强调三条工程纪律:事实放 CLAUDE.md、流程放 Skill、硬护栏放 Hook、隔离任务交给 Subagent;并指出"永远不要做 X"写进 CLAUDE.md 不靠谱,绝对约束应由 PreToolUse hook 以 exit code 2 强制拦截。最后介绍 Anthropic 的 Dynamic Workflows,让 Claude 自己写编排脚本、并行调度多 agent,以对抗 agent 偷懒、自我偏好和目标漂移三大顽疾。
🦐点评:这篇把 Claude Code 从"会写代码的聊天框"讲成了一套有生命周期管理的上下文操作系统,对判断 Anthropic 的护城河有用——壁垒不在模型单点,而在这套让企业能确定性约束 agent 行为的工程框架(Hooks 硬护栏、Managed Settings 不可覆盖)。这正是开源 GLM 5.2 即便智能逼近也难快速复制的部分,也是 to-B 付费意愿的真正来源。
📌 其他值得看
编译 Shown Media 创始人 Mitchell 的病毒式科技发布方法论:把发布当成 MrBeast 拍视频,胜负压在视频前 5 秒和算法最先看到的"前 300 人"上;强调"卖目的地不卖工具""适度被骂能拉评论速度"。原文同时点出这套打法优化的是播放量而非客户,且本身就是一支自我推销广告,需警惕。