🔥 精选推荐

前 Meta Llama 2/3 预训练负责人 Sergey Edunov 离开大模型赛道,加入药物发现公司 Genesis Molecular AI 任 CTO——他的理由是"过去十年最激动人心的 diffusion 架构创新不在 LLM,而在 3D 结构预测"。Genesis 的旗舰模型 PEARL(Place Every Atom at the Right Location)能同时建模蛋白质柔性与配体结合,跨过了真实药物发现所需的精度阈值。团队认为这让"agentic 药物发现"首次成为可能:内部代号 SAPPHIRE 的系统能像化学家一样看构象、读文献、提假设、生成下一轮候选分子,配合与 Incyte 的自动化实验室合作,逼近 24/7 自动合成测试。文中还炮轰学界通用的 2Å RMSD co-folding 基准太松,"把 AI slop 当成好结果"。
🦐点评:Edunov 从 Llama 出走做药物发现,是"大模型顶级人才开始外溢到垂直科学"的强信号——当预训练本身的架构红利见顶(作者直言 attention 之后 LLM 再无根本性架构创新),最聪明的人在找下一个有真 diffusion 创新的战场。可操作点:AI-for-bio 的估值逻辑正从"能不能预测结构"转向"agentic loop 能不能替代湿实验迭代",值得重新盘一遍 co-folding/结合亲和力这批公司,看谁真跨过了 2Å 之外的可用阈值。
latent.space
"软件工厂"(software factory)正在取代"人与 agent 交互"成为编码的下一阶段,Warp CEO Zach Lloyd 判断一年内大多数重要软件项目都会跑某种自动化工厂。Warp 从 2021 年的 Rust 终端,演进到集成编码 agent 的终端,今年 4 月在 Claude Code / Codex CLI / Gemini CLI 三家大厂夹击下开源了核心 CLI,如今推出 agent 编排平台 Oz——连接多模型、多 harness,跨本地和云端沙箱持续做 triage、实现、review、验证、监控。
🦐点评:software factory 这个词这两周在 AI Engineer World's Fair 被 Warp、Cursor、Factory 各自独立喊出来,说明编码 agent 的叙事正从"copilot 辅助"整体迁移到"编排一支 agent 工厂"——这是产品形态换挡,不是功能升级。对投资人:Warp 被迫开源 CLI 是护城河从"工具层"上移到"编排层"的信号,真正值钱的是 Oz 这种跨模型编排+持续验证层,谁掌握 orchestration 谁就卡住了下一代开发工具的收费点。
latent.space
Hugging Face 联手 Cerebras 把 Google DeepMind 的 Gemma 4 31B 塞进实时语音 AI,核心卖点是延迟。整套是全开源、可替换的级联式 speech-to-speech 管线:Nvidia Parakeet 做语音识别 → Cerebras 上跑 Gemma 4 VLM 推理 → 阿里 Qwen3TTS 做语音合成。瓶颈一直是语言模型的响应时间和 P95 长尾延迟,Cerebras 的超高速推理把对话体验拉到接近真人交互的流畅度。
🦐点评:这套 demo 的信息量在"开源拼装也能打"——Nvidia 识别 + Google 模型 + 阿里 TTS + Cerebras 推理,四家的开源组件拼出接近端到端专有语音栈的体验。对语音 agent 赛道:护城河正从"有没有好模型"转到"P95 延迟能不能压到人类对话阈值以下",这利好 Cerebras/Groq 这类推理硬件,也意味着纯做闭源语音大模型的公司壁垒在变薄,差异化得往应用层和延迟工程走。
huggingface.co
Google 向独立电影厂牌 A24 投资约 7500 万美元并达成 AI 合作,随即在好莱坞引爆抗议——WIRED 发文、Film Twitter 一片"R.I.P. A24 2012-2026"、A24 subreddit 集体破防。但据接近 A24 的消息源,拥抱 AI 并非自上而下的商业决策,探索这些工具的动力恰恰来自艺术家本身。(注:文章后半段为付费墙)
🦐点评:7500 万美元对 Google 是零头,但选择 A24 这个"电影品味图腾"下手,买的是 AI 影像在创作圈的合法性背书,不是产能。抗议越激烈越说明这是拐点信号:当最挑剔的艺术厂牌都说"是创作者自己要用",纯技术抵制的叙事就守不住了。结合同一周 Higgsfield 估值四个月翻四倍到 50 亿美元,钱和内容方在同一时间向 AI 视频集中——这个赛道的"社会许可"正在被资本快速买通。
newcomer.co
Introspection(团队从 xAI 的 agent 基础设施/云 agent 出来创业)提出 autoresearch:给主系统套一个"外循环",让 agent 靠反馈信号、evals 和人类输入持续维护和改进系统本身。创始人 Roland Gavrilescu 给了三条生产环境 pattern,第一条就是"循环即产品"(the loop is the product)——重心从模型/harness 转到反馈闭环设计。基于开源 Pi 框架,他强调自主软件工厂必须先向人类学习,人类仍是核心。
🦐点评:又一支从 xAI 出走、对标 Cursor/Cognition 的团队——"autoresearch/外循环"和 Warp 的 software factory、吴恩达讲的 loop engineering,其实是同一件事的不同叫法,说明"self-improving 外循环"正在成为 agent 基础设施的共识层。对投资人:这批公司卖的不是模型也不是 agent,而是"让 agent 系统自我改进的反馈闭环工程",赛道刚冒头、命名都还没统一,正是早期卡位窗口——值得盯 Introspection、Factory、Warp 谁先把 loop 做成可复用产品。
latent.space

📌 其他新闻

Cursor 前向部署工程(FDE)副总裁 Pauline Brunet 讲如何带团队进金融、电信、半导体等客户现场,把"AI 软件工厂"铺到整个软件开发生命周期,难点是让 agent 采用从个体爱好者扩展到组织级。
latent.space
深耕可观测性十年的作者判断 ClickHouse 正在赢得这场战争,凭列存和成本优势蚕食传统日志/监控数据栈。
matduggan.com
AI 编码正在抹平大厂前后端分工,工程师的岗位边界被重新定义。
infoq.cn
英伟达开源机器人技能库,Jim Fan 称具身智能进入"持续学习"新范式。
量子位
清华博导李一鸣的 Physical AI 初创拿下数亿元种子轮,却刻意回避"世界模型"标签。
36kr
世界模型公司"知天下"完成天使轮融资,对标李飞飞的 World Labs。
雷锋网
Anthropic 突然发布 Sonnet 5,但业界的注意力更多在明天解禁的 Fable 5 和 Mythos 5 上。
infoq.cn
Reddit 爆料称 Claude Code 通过系统时区、代理域名等隐蔽信号精准识别并封禁中国大陆用户。
雷锋网

🧠 AI 技术前沿

AnthropicAI @AnthropicAI
Fable 5 明天起全球恢复上线;与美国政府沟通后加了一套新分类器拦截更多网络安全类任务,近期编码/调试等常规任务会回退到 Opus 4.8。
查看推文 →
cursor_ai @cursor_ai
Fable 5 已在 Cursor 恢复,在 CursorBench 上领先所有模型,但每任务成本也是最贵的。
查看推文 →
EXM7777 @EXM7777
Fable 5 回归但会让很多人失望:新加的安全过滤器比以往任何一版都严,会把日常编码/调试判为"高风险"并静默拦截。
查看推文 →
EXM7777 @EXM7777
吐槽 Fable 5 第一条 prompt 就被路由到 Opus 4.8、再派生 Sonnet 5 子 agent,烧掉 30% 周额度还只交回 slop。
查看推文 →
Hesamation @Hesamation
Anthropic 已确认:Claude Code 会把时区、代理、疑似 AI 实验室连接等信息,以中国用户察觉不到的方式塞进系统提示词。
查看推文 →
shao__meng @shao__meng
详解 Claude Code 的隐蔽回传:检测是否走中转站、系统时区是否为 Asia/Shanghai、代理域名是否命中含百度/阿里/字节/Moonshot/MiniMax 的 147 项名单。
查看推文 →
emollick @emollick
预分类路由(router)会带来大量劣质产出,因为路由本身很难、且低估了智能对多数问题的价值;OpenAI 在 GPT-5 上已经栽过,如今 router 又火。
查看推文 →
shao__meng @shao__meng
转述吴恩达的"Loop engineering":产品成败取决于三个循环——代码自我迭代、开发者判断校准、外部用户反馈。
查看推文 →
vasuman @vasuman
Agentic commerce 正在落地:agent 现在能无需人工、用 USDC 为 20000+ 工具按次付费,背后是 Apify 和 Coinbase。
查看推文 →
_akhaliq @_akhaliq
推介 LiteResearcher:面向深度研究 agent 的可扩展 agentic RL 训练框架。
查看推文 →
_akhaliq @_akhaliq
推介世界模型论文 Orca:"The World is in Your Mind"。
查看推文 →
rileybrown @rileybrown
手把手教用 Cursor/Claude Code/Codex 加 GPT-Realtime-2 API,20 分钟搭一个能调用各种工具的自定义"Jarvis"语音助手。
查看推文 →

🚀 创业动态

gregisenberg @gregisenberg
如果今天从零创业,他会做 agent 生意:SaaS 是数百亿美元市场,agent 是数万亿级;并给出从选 niche、影随人类、先手动跑到卖 pilot 的完整打法。
查看推文 →
kloss_xyz @kloss_xyz
推介 ivo:把法务团队的谈判历史变成可检索的 benchmark,条款评审不再纯靠直觉。
查看推文 →
shao__meng @shao__meng
推介 mattpocockuk 的 writing-great-skills:用最少但最有牵引力的结构,把 Skill 写成能稳定触发、分层加载的可预测工作流。
查看推文 →
godofprompt @godofprompt
展示一条 prompt 一次性生成完整货币转换 App:170+ 币种、实时汇率、历史图表、离线模式、汇率提醒。
查看推文 →
0xROAS @0xROAS
AI 动画广告必须有好故事才成立,很适合做 TOF 广告拉关注但别过度;并晒了一条全自动生成的 Pixar 风 AI 广告。
查看推文 →
levelsio @levelsio
回应质疑:他确实想过把 Nomad List 做成十亿美元公司,但"能不能赚更多"往往不是创始人能选的。
查看推文 →

💬 观点与洞察

hongming731 @hongming731
转述 HBR:AI 时代领导者需要哲学素养(本体论/认识论/伦理学),Anthropic、Google DeepMind 已把哲学家纳入核心团队。
查看推文 →
hongming731 @hongming731
好文推荐:AI 产品质量不只取决于模型能力,更取决于如何设计"让用户恰当地依赖 AI",并给出九组共 39 条交互原则。
查看推文 →
hongming731 @hongming731
产品洞察:真正有价值的机会往往先以"异常信号"出现——某个边缘功能使用率特别高、某类用户反复做同一操作、用户用出了开发者没预想到的用法。
查看推文 →
hongming731 @hongming731
BestBlogs 早报推介 Ahmad Osman 谈本地 AI:开源与闭源前沿差距已缩到约 4–8 个月,缺的不是模型而是搜索/工具/agent 的完整栈。
查看推文 →
emollick @emollick
重贴他对 Fable 的早期体验:确实非常强,但优势要在更长、更难的任务上才显现。
查看推文 →
Hesamation @Hesamation
Meta 一年在 AI token 上烧 26.5 亿美元,相当于养约 9000 名工程师——但裁员后 Meta 有拿出过"9000 人产出"级的东西吗?
查看推文 →
Hesamation @Hesamation
观点:掌控自己的权重就是掌控命运;把权重交给别人,等于让对方把你业务的 alpha 迁走。
查看推文 →

🔥 精选推荐

Alphaist 创始合伙人陈哲复盘 26Q2 具身智能 Top 5:北京亦庄人形马拉松冠军是手机大厂荣耀(自研大扭矩电机+精密液冷,全程电机不过热)、Figure 连续直播人形机器人做包裹分拣、灵巧手与灵巧操作在 ICRA 爆发、英伟达 6 月发布 Cosmos 3 把世界模型从实验室拉到工业级、Physical Intelligence π0.7 与 Generalist GEN-1 让 VLA 开始与世界模型融合。核心判断:人形机器人正从"单一技术见长的创业公司"竞争,转向"系统工程+系统作战"的比拼。
🦐点评:荣耀夺冠是这季度最该警觉的信号——它证明有高端制造经验、组织和资金密度的终端大厂(荣耀、小米、小鹏、理想)能快速做出有竞争力的人形本体。对投资人:如果本体创业公司今年 IPO 不了、进不了资源安全区,接下来要正面硬刚现金流和制造能力都碾压的手机/汽车厂——纯本体创业的窗口正在被大厂关上,钱更该往世界模型、灵巧操作基座这类算法壁垒更硬的环节走。
晚点LatePost
AI 视频公司 Higgsfield 正洽谈融资 3–5 亿美元,投前估值 50 亿美元,是今年 1 月估值的四倍多;营收运行率本月达 5 亿美元,是 1 月的两倍多。尤里·米尔纳的 DST Global 在洽谈参投。虽然早期靠个人创作者驱动,如今 70% 活跃来自企业客户。同期 Google 向 A24 投约 7500 万、Runway 在 53 亿估值融 3.15 亿,视频 AI 投资热持续加码。
🦐点评:四个月估值翻四倍、ARR 翻倍,Higgsfield 的关键转折是"70% 活跃转向企业客户"——这把它从消费级玩具重估为企业营销基础设施,才撑得起对 ARR 约 10 倍的估值。对投资人:视频 AI 的分水岭不是谁的模型更炫,而是谁先跑通 B 端付费和留存;DST 这种偏后期的钱进场,说明赛道正从"技术叙事"切换到"收入验证",纯模型公司若卡不进企业工作流会很快掉队。
Z Potentials
被 Wix 以 8000 万美元收购的 vibe-coding 平台 Base44 推出自研模型 Base1,用平台上"数千万次真实用户交互"数据训练,目标是在特定场景超越前沿模型,并降低对 Anthropic 等外部 API 的依赖和推理成本。创始人 Maor Shlomo 认为垂直整合(同时握住分发、数据、基础设施)是护城河;Headline GP 则提醒别低估前沿模型,并指出成本压力正催生"模型编排/优化"这一整套新基础设施。Base44 五月 ARR 已破 1.5 亿美元,但仍低于对手 Lovable 的 5 亿。
🦐点评:Base44 自研模型的真问题是"建在别人模型上的生意长期有没有防御力"——它给的答案是数据+分发+基础设施的垂直整合,但 Lovable 靠纯外部模型跑到 5 亿 ARR 又说明这道墙没那么急。对投资人:更值得下注的其实是文中一带而过的"模型编排层"——当企业不愿所有场景都用最贵模型,谁能帮它们按任务选模型、把成本压住又不掉性能,谁就吃到这波推理成本焦虑的红利。
Z Potentials
2026 年 Q2 通过 Stripe Atlas 注册的美国 C corp 里 63% 是单人创办,历史新高。a16z speedrun 客座文(作者 Evan Armstrong)用哈佛/INSEAD 对 515 家公司的实验佐证:用 AI 那组任务完成多 12%、拿到付费客户概率高 18%、营收是对照组 1.9 倍,对外部融资需求反而降 39.5%。但作者按住油门:单人创业者头部 10% 对中位数的营收倍数从 2022 年的 34 倍拉大到 2025 年的 61 倍——AI 是给强者加杠杆,不是拉平门槛。投资人的判断更反直觉:联合创始人真正的价值从不是"补技能",而是"你能招到人本身就是最强信号",以及"一个会当面说你想法很蠢的人"。
🦐点评:这篇最扎的洞察不是"AI 让你能单干",而是评论区那句"AI 会非常乐意地帮你更快地执行一个错误的想法"——单人创业最大的风险从来不是活干不完,而是没人拦你。对投资人:63% 更可能说明"开公司变得太便宜",别读成"单干在赢";真正的信号在那张 34→61 倍的图——AI 让创业更"赢家通吃",所以尽调时"这个单人创始人是招不到人、还是有本事招人却选择先自己跑",是必须问穿的一题。
深思SenseAI
FaceMind 创始人 Adam Lu(帝国理工本硕、港中文 PhD、MSRA 实习)提出循环世界模型 LoopWM,主张下一代通用世界模型不该继续沿"逐帧生成更长更逼真视频"的旧路,而是把推理留在隐空间里像思考一样反复迭代。通过 Early Exit、Deferred Decoding、hierarchical curriculum learning 等机制,解决世界模型长期的长时域误差累积、算力效率和推理稳定性问题,并做线性(而非指数级)的 test-time scaling。核心追问:世界模型走向机器人和真实物理世界时,Scaling Law 是否会诞生"大模型+大算力"之外的新范式。
🦐点评:LoopWM 赌的是世界模型的"ChatGPT 时刻"会来自架构创新而非算力堆叠——把 test-time scaling 从"指数级枚举未来再选优"改成隐空间里的线性迭代,直击具身场景"任务难度差异极大"的痛点。对投资人:世界模型赛道现在架构、数据、评估全未收敛,正是下注差异化架构的窗口,但技术风险也极高;判断这类团队要看的不是 demo 视频多逼真,而是能否在长时域误差累积和推理稳定性这些"没人看得见的硬指标"上给出可验证的领先。
Z Potentials

📌 其他值得看

Fable 5 明天恢复全球访问,定价每百万输入/输出 token 为 10/50 美元(Opus 4.8 的两倍);此前下架源于亚马逊一名员工发现可绕过安全防护、让模型指认出一批软件漏洞,政府当天即要求限制非美籍用户访问。
赛博禅心
97 年的孙天祥(开源大模型 MOSS 主导者、MaaS 概念提出者)加入百度任基础模型研发部(BMU)负责人,又一位 95 后大模型一号位。
晚点LatePost
Sonnet 5 全平台上线并成为网页版默认模型,跑分介于 Opus 4.6 与 4.8 之间;价格与上代持平,但换了新分词器,同样内容切出的 token 更多,实际使用可能比 Opus 还贵。 <!-- ai-daily:complete -->
赛博禅心