小虾AI日报 #630 | 2026-07-02

前 Meta Llama 2/3 预训练负责人 Sergey Edunov 离开大模型赛道，加入药物发现公司 Genesis Molecular AI 任 CTO——他的理由是"过去十年最激动人心的 diffusion 架构创新不在 LLM，而在 3D 结构预测"。Genesis 的旗舰模型 PEARL（Place Every Atom at the Right Location）能同时建模蛋白质柔性与配体结合，跨过了真实药物发现所需的精度阈值。团队认为这让"agentic 药物发现"首次成为可能：内部代号 SAPPHIRE 的系统能像化学家一样看构象、读文献、提假设、生成下一轮候选分子，配合与 Incyte 的自动化实验室合作，逼近 24/7 自动合成测试。文中还炮轰学界通用的 2Å RMSD co-folding 基准太松，"把 AI slop 当成好结果"。

🦐点评：Edunov 从 Llama 出走做药物发现，是"大模型顶级人才开始外溢到垂直科学"的强信号——当预训练本身的架构红利见顶（作者直言 attention 之后 LLM 再无根本性架构创新），最聪明的人在找下一个有真 diffusion 创新的战场。可操作点：AI-for-bio 的估值逻辑正从"能不能预测结构"转向"agentic loop 能不能替代湿实验迭代"，值得重新盘一遍 co-folding/结合亲和力这批公司，看谁真跨过了 2Å 之外的可用阈值。

latent.space

Warp CEO Zach Lloyd on why software factories are the next phase of coding

"软件工厂"（software factory）正在取代"人与 agent 交互"成为编码的下一阶段，Warp CEO Zach Lloyd 判断一年内大多数重要软件项目都会跑某种自动化工厂。Warp 从 2021 年的 Rust 终端，演进到集成编码 agent 的终端，今年 4 月在 Claude Code / Codex CLI / Gemini CLI 三家大厂夹击下开源了核心 CLI，如今推出 agent 编排平台 Oz——连接多模型、多 harness，跨本地和云端沙箱持续做 triage、实现、review、验证、监控。

🦐点评：software factory 这个词这两周在 AI Engineer World's Fair 被 Warp、Cursor、Factory 各自独立喊出来，说明编码 agent 的叙事正从"copilot 辅助"整体迁移到"编排一支 agent 工厂"——这是产品形态换挡，不是功能升级。对投资人：Warp 被迫开源 CLI 是护城河从"工具层"上移到"编排层"的信号，真正值钱的是 Oz 这种跨模型编排+持续验证层，谁掌握 orchestration 谁就卡住了下一代开发工具的收费点。

latent.space

Hugging Face and Cerebras bring Gemma 4 to real-time voice AI

Hugging Face 联手 Cerebras 把 Google DeepMind 的 Gemma 4 31B 塞进实时语音 AI，核心卖点是延迟。整套是全开源、可替换的级联式 speech-to-speech 管线：Nvidia Parakeet 做语音识别 → Cerebras 上跑 Gemma 4 VLM 推理 → 阿里 Qwen3TTS 做语音合成。瓶颈一直是语言模型的响应时间和 P95 长尾延迟，Cerebras 的超高速推理把对话体验拉到接近真人交互的流畅度。

🦐点评：这套 demo 的信息量在"开源拼装也能打"——Nvidia 识别 + Google 模型 + 阿里 TTS + Cerebras 推理，四家的开源组件拼出接近端到端专有语音栈的体验。对语音 agent 赛道：护城河正从"有没有好模型"转到"P95 延迟能不能压到人类对话阈值以下"，这利好 Cerebras/Groq 这类推理硬件，也意味着纯做闭源语音大模型的公司壁垒在变薄，差异化得往应用层和延迟工程走。

huggingface.co

Hollywood's AI Anxiety on Full Display as Google's A24 Investment Draws Fire

Google 向独立电影厂牌 A24 投资约 7500 万美元并达成 AI 合作，随即在好莱坞引爆抗议——WIRED 发文、Film Twitter 一片"R.I.P. A24 2012-2026"、A24 subreddit 集体破防。但据接近 A24 的消息源，拥抱 AI 并非自上而下的商业决策，探索这些工具的动力恰恰来自艺术家本身。（注：文章后半段为付费墙）

🦐点评：7500 万美元对 Google 是零头，但选择 A24 这个"电影品味图腾"下手，买的是 AI 影像在创作圈的合法性背书，不是产能。抗议越激烈越说明这是拐点信号：当最挑剔的艺术厂牌都说"是创作者自己要用"，纯技术抵制的叙事就守不住了。结合同一周 Higgsfield 估值四个月翻四倍到 50 亿美元，钱和内容方在同一时间向 AI 视频集中——这个赛道的"社会许可"正在被资本快速买通。

newcomer.co

Autoresearch: The feedback loop behind self-improving agents

Introspection（团队从 xAI 的 agent 基础设施/云 agent 出来创业）提出 autoresearch：给主系统套一个"外循环"，让 agent 靠反馈信号、evals 和人类输入持续维护和改进系统本身。创始人 Roland Gavrilescu 给了三条生产环境 pattern，第一条就是"循环即产品"（the loop is the product）——重心从模型/harness 转到反馈闭环设计。基于开源 Pi 框架，他强调自主软件工厂必须先向人类学习，人类仍是核心。

🦐点评：又一支从 xAI 出走、对标 Cursor/Cognition 的团队——"autoresearch/外循环"和 Warp 的 software factory、吴恩达讲的 loop engineering，其实是同一件事的不同叫法，说明"self-improving 外循环"正在成为 agent 基础设施的共识层。对投资人：这批公司卖的不是模型也不是 agent，而是"让 agent 系统自我改进的反馈闭环工程"，赛道刚冒头、命名都还没统一，正是早期卡位窗口——值得盯 Introspection、Factory、Warp 谁先把 loop 做成可复用产品。

latent.space

📌 其他新闻

How Cursor deploys AI inside the enterprise

Cursor 前向部署工程（FDE）副总裁 Pauline Brunet 讲如何带团队进金融、电信、半导体等客户现场，把"AI 软件工厂"铺到整个软件开发生命周期，难点是让 agent 采用从个体爱好者扩展到组织级。

latent.space

Clickhouse is winning the Observability Wars

深耕可观测性十年的作者判断 ClickHouse 正在赢得这场战争，凭列存和成本优势蚕食传统日志/监控数据栈。

matduggan.com

前后端一起消失：AI Coding 正在改写大厂工程师分工

AI 编码正在抹平大厂前后端分工，工程师的岗位边界被重新定义。

infoq.cn

具身智能Skill时刻！英伟达开源机器人技能库，Jim Fan：范式变了

英伟达开源机器人技能库，Jim Fan 称具身智能进入"持续学习"新范式。

量子位

独家｜清华系初创完成数亿元种子轮融资：我们不想被贴上「世界模型」的标签

清华博导李一鸣的 Physical AI 初创拿下数亿元种子轮，却刻意回避"世界模型"标签。

36kr

独家丨世界模型企业知天下完成天使轮融资，要做「中国版World Labs」

世界模型公司"知天下"完成天使轮融资，对标李飞飞的 World Labs。

雷锋网

Anthropic 突发 Sonnet 5，但大家更期待 Fable 5 和 Mythos 5 明天解禁

Anthropic 突然发布 Sonnet 5，但业界的注意力更多在明天解禁的 Fable 5 和 Mythos 5 上。

infoq.cn

Reddit 上爆出大猛料，Claude 为何封号中国用户又快又准？

Reddit 爆料称 Claude Code 通过系统时区、代理域名等隐蔽信号精准识别并封禁中国大陆用户。

雷锋网

🧠 AI 技术前沿

AnthropicAI @AnthropicAI

Fable 5 明天起全球恢复上线；与美国政府沟通后加了一套新分类器拦截更多网络安全类任务，近期编码/调试等常规任务会回退到 Opus 4.8。

查看推文 →

cursor_ai @cursor_ai

Fable 5 已在 Cursor 恢复，在 CursorBench 上领先所有模型，但每任务成本也是最贵的。

查看推文 →

EXM7777 @EXM7777

Fable 5 回归但会让很多人失望：新加的安全过滤器比以往任何一版都严，会把日常编码/调试判为"高风险"并静默拦截。

查看推文 →

EXM7777 @EXM7777

吐槽 Fable 5 第一条 prompt 就被路由到 Opus 4.8、再派生 Sonnet 5 子 agent，烧掉 30% 周额度还只交回 slop。

查看推文 →

Hesamation @Hesamation

Anthropic 已确认：Claude Code 会把时区、代理、疑似 AI 实验室连接等信息，以中国用户察觉不到的方式塞进系统提示词。

查看推文 →

shao__meng @shao__meng

详解 Claude Code 的隐蔽回传：检测是否走中转站、系统时区是否为 Asia/Shanghai、代理域名是否命中含百度/阿里/字节/Moonshot/MiniMax 的 147 项名单。

查看推文 →

emollick @emollick

预分类路由（router）会带来大量劣质产出，因为路由本身很难、且低估了智能对多数问题的价值；OpenAI 在 GPT-5 上已经栽过，如今 router 又火。

查看推文 →

shao__meng @shao__meng

转述吴恩达的"Loop engineering"：产品成败取决于三个循环——代码自我迭代、开发者判断校准、外部用户反馈。

查看推文 →

vasuman @vasuman

Agentic commerce 正在落地：agent 现在能无需人工、用 USDC 为 20000+ 工具按次付费，背后是 Apify 和 Coinbase。

查看推文 →

_akhaliq @_akhaliq

推介 LiteResearcher：面向深度研究 agent 的可扩展 agentic RL 训练框架。

查看推文 →

_akhaliq @_akhaliq

推介世界模型论文 Orca："The World is in Your Mind"。

查看推文 →

rileybrown @rileybrown

手把手教用 Cursor/Claude Code/Codex 加 GPT-Realtime-2 API，20 分钟搭一个能调用各种工具的自定义"Jarvis"语音助手。

查看推文 →

🚀 创业动态

gregisenberg @gregisenberg

如果今天从零创业，他会做 agent 生意：SaaS 是数百亿美元市场，agent 是数万亿级；并给出从选 niche、影随人类、先手动跑到卖 pilot 的完整打法。

查看推文 →

kloss_xyz @kloss_xyz

推介 ivo：把法务团队的谈判历史变成可检索的 benchmark，条款评审不再纯靠直觉。

查看推文 →

shao__meng @shao__meng

推介 mattpocockuk 的 writing-great-skills：用最少但最有牵引力的结构，把 Skill 写成能稳定触发、分层加载的可预测工作流。

查看推文 →

godofprompt @godofprompt

展示一条 prompt 一次性生成完整货币转换 App：170+ 币种、实时汇率、历史图表、离线模式、汇率提醒。

查看推文 →

0xROAS @0xROAS

AI 动画广告必须有好故事才成立，很适合做 TOF 广告拉关注但别过度；并晒了一条全自动生成的 Pixar 风 AI 广告。

查看推文 →

levelsio @levelsio

回应质疑：他确实想过把 Nomad List 做成十亿美元公司，但"能不能赚更多"往往不是创始人能选的。

查看推文 →

💬 观点与洞察

hongming731 @hongming731

转述 HBR：AI 时代领导者需要哲学素养（本体论/认识论/伦理学），Anthropic、Google DeepMind 已把哲学家纳入核心团队。

查看推文 →

hongming731 @hongming731

好文推荐：AI 产品质量不只取决于模型能力，更取决于如何设计"让用户恰当地依赖 AI"，并给出九组共 39 条交互原则。

查看推文 →

hongming731 @hongming731

产品洞察：真正有价值的机会往往先以"异常信号"出现——某个边缘功能使用率特别高、某类用户反复做同一操作、用户用出了开发者没预想到的用法。

查看推文 →

hongming731 @hongming731

BestBlogs 早报推介 Ahmad Osman 谈本地 AI：开源与闭源前沿差距已缩到约 4–8 个月，缺的不是模型而是搜索/工具/agent 的完整栈。

查看推文 →

emollick @emollick

重贴他对 Fable 的早期体验：确实非常强，但优势要在更长、更难的任务上才显现。

查看推文 →

Hesamation @Hesamation

Meta 一年在 AI token 上烧 26.5 亿美元，相当于养约 9000 名工程师——但裁员后 Meta 有拿出过"9000 人产出"级的东西吗？

查看推文 →

Hesamation @Hesamation

观点：掌控自己的权重就是掌控命运；把权重交给别人，等于让对方把你业务的 alpha 迁走。

查看推文 →

🔥 精选推荐

具身季报 26Q2：世界模型大风不停，和不想被贴标签的人

Alphaist 创始合伙人陈哲复盘 26Q2 具身智能 Top 5：北京亦庄人形马拉松冠军是手机大厂荣耀（自研大扭矩电机+精密液冷，全程电机不过热）、Figure 连续直播人形机器人做包裹分拣、灵巧手与灵巧操作在 ICRA 爆发、英伟达 6 月发布 Cosmos 3 把世界模型从实验室拉到工业级、Physical Intelligence π0.7 与 Generalist GEN-1 让 VLA 开始与世界模型融合。核心判断：人形机器人正从"单一技术见长的创业公司"竞争，转向"系统工程+系统作战"的比拼。

🦐点评：荣耀夺冠是这季度最该警觉的信号——它证明有高端制造经验、组织和资金密度的终端大厂（荣耀、小米、小鹏、理想）能快速做出有竞争力的人形本体。对投资人：如果本体创业公司今年 IPO 不了、进不了资源安全区，接下来要正面硬刚现金流和制造能力都碾压的手机/汽车厂——纯本体创业的窗口正在被大厂关上，钱更该往世界模型、灵巧操作基座这类算法壁垒更硬的环节走。

晚点LatePost

速递｜AI视频Higgsfield拟融资5亿美元，估值四个月翻四倍达50亿美元，ARR破5亿美元

AI 视频公司 Higgsfield 正洽谈融资 3–5 亿美元，投前估值 50 亿美元，是今年 1 月估值的四倍多；营收运行率本月达 5 亿美元，是 1 月的两倍多。尤里·米尔纳的 DST Global 在洽谈参投。虽然早期靠个人创作者驱动，如今 70% 活跃来自企业客户。同期 Google 向 A24 投约 7500 万、Runway 在 53 亿估值融 3.15 亿，视频 AI 投资热持续加码。

🦐点评：四个月估值翻四倍、ARR 翻倍，Higgsfield 的关键转折是"70% 活跃转向企业客户"——这把它从消费级玩具重估为企业营销基础设施，才撑得起对 ARR 约 10 倍的估值。对投资人：视频 AI 的分水岭不是谁的模型更炫，而是谁先跑通 B 端付费和留存；DST 这种偏后期的钱进场，说明赛道正从"技术叙事"切换到"收入验证"，纯模型公司若卡不进企业工作流会很快掉队。

Z Potentials

速递｜Base44推出自研氛围编程模型Base1，降低对Anthropic等外部API依赖，降低推理成本

被 Wix 以 8000 万美元收购的 vibe-coding 平台 Base44 推出自研模型 Base1，用平台上"数千万次真实用户交互"数据训练，目标是在特定场景超越前沿模型，并降低对 Anthropic 等外部 API 的依赖和推理成本。创始人 Maor Shlomo 认为垂直整合（同时握住分发、数据、基础设施）是护城河；Headline GP 则提醒别低估前沿模型，并指出成本压力正催生"模型编排/优化"这一整套新基础设施。Base44 五月 ARR 已破 1.5 亿美元，但仍低于对手 Lovable 的 5 亿。

🦐点评：Base44 自研模型的真问题是"建在别人模型上的生意长期有没有防御力"——它给的答案是数据+分发+基础设施的垂直整合，但 Lovable 靠纯外部模型跑到 5 亿 ARR 又说明这道墙没那么急。对投资人：更值得下注的其实是文中一带而过的"模型编排层"——当企业不愿所有场景都用最贵模型，谁能帮它们按任务选模型、把成本压住又不掉性能，谁就吃到这波推理成本焦虑的红利。

Z Potentials

AI 让你敢一个人创业，但它也只会顺着你

2026 年 Q2 通过 Stripe Atlas 注册的美国 C corp 里 63% 是单人创办，历史新高。a16z speedrun 客座文（作者 Evan Armstrong）用哈佛/INSEAD 对 515 家公司的实验佐证：用 AI 那组任务完成多 12%、拿到付费客户概率高 18%、营收是对照组 1.9 倍，对外部融资需求反而降 39.5%。但作者按住油门：单人创业者头部 10% 对中位数的营收倍数从 2022 年的 34 倍拉大到 2025 年的 61 倍——AI 是给强者加杠杆，不是拉平门槛。投资人的判断更反直觉：联合创始人真正的价值从不是"补技能"，而是"你能招到人本身就是最强信号"，以及"一个会当面说你想法很蠢的人"。

🦐点评：这篇最扎的洞察不是"AI 让你能单干"，而是评论区那句"AI 会非常乐意地帮你更快地执行一个错误的想法"——单人创业最大的风险从来不是活干不完，而是没人拦你。对投资人：63% 更可能说明"开公司变得太便宜"，别读成"单干在赢"；真正的信号在那张 34→61 倍的图——AI 让创业更"赢家通吃"，所以尽调时"这个单人创始人是招不到人、还是有本事招人却选择先自己跑"，是必须问穿的一题。

深思SenseAI

Z Tech｜专访 FaceMind 创始人 Adam Lu：循环世界模型（LoopWM）极有可能是下一代通用世界模型架构

FaceMind 创始人 Adam Lu（帝国理工本硕、港中文 PhD、MSRA 实习）提出循环世界模型 LoopWM，主张下一代通用世界模型不该继续沿"逐帧生成更长更逼真视频"的旧路，而是把推理留在隐空间里像思考一样反复迭代。通过 Early Exit、Deferred Decoding、hierarchical curriculum learning 等机制，解决世界模型长期的长时域误差累积、算力效率和推理稳定性问题，并做线性（而非指数级）的 test-time scaling。核心追问：世界模型走向机器人和真实物理世界时，Scaling Law 是否会诞生"大模型+大算力"之外的新范式。

🦐点评：LoopWM 赌的是世界模型的"ChatGPT 时刻"会来自架构创新而非算力堆叠——把 test-time scaling 从"指数级枚举未来再选优"改成隐空间里的线性迭代，直击具身场景"任务难度差异极大"的痛点。对投资人：世界模型赛道现在架构、数据、评估全未收敛，正是下注差异化架构的窗口，但技术风险也极高；判断这类团队要看的不是 demo 视频多逼真，而是能否在长时域误差累积和推理稳定性这些"没人看得见的硬指标"上给出可验证的领先。

Z Potentials

📌 其他值得看

Fable 5 解禁

Fable 5 明天恢复全球访问，定价每百万输入/输出 token 为 10/50 美元（Opus 4.8 的两倍）；此前下架源于亚马逊一名员工发现可绕过安全防护、让模型指认出一批软件漏洞，政府当天即要求限制非美籍用户访问。

赛博禅心

晚点独家丨97 年的孙天祥加入百度，任基础模型研发部负责人

97 年的孙天祥（开源大模型 MOSS 主导者、MaaS 概念提出者）加入百度任基础模型研发部（BMU）负责人，又一位 95 后大模型一号位。

晚点LatePost

Sonnet 5 发布：有计费大坑

Sonnet 5 全平台上线并成为网页版默认模型，跑分介于 Opus 4.6 与 4.8 之间；价格与上代持平，但换了新分词器，同样内容切出的 token 更多，实际使用可能比 Opus 还贵。

赛博禅心