🔥 精选推荐

5 个人、10 周、零文档,从 0 代码做到一线发布——Gusto CTO Eddie Kim 亲自带 3 名工程师 + 1 名设计师,用 Claude Code 造出了全新 AI 产品 Gusto Cofounder(Gusto 主业刚过 10 亿美元营收、服务 50 万+小企业)。他们几乎扔掉了所有流程:没有 Figma、Jira、文档,用"垃圾桶法"——把一个完整 PR 写出来、评审、再删掉,当成产品决策而非写规划文档;用一个常开的"永久 Zoom"取代站会、复盘和 Slack;一名没有工程背景的设计师靠 Claude Code 冲到了出码效率的第 94 百分位。
🦐点评:真正的信号不是"AI 提效",而是产品组织的最小可行单位正在坍缩——一条产品线 10 周做完,过去要 30 人团队加一个季度。对看 B2B SaaS 的基金,这逼着重估两件事:一是早期团队的人效基准被重画,5 个人能干的活不该再按 5 人估值;二是"流程型"工具(Jira/Figma/文档协作)的需求侧正在被"写完即弃的 PR"这种新工作流侵蚀——那个不用 Figma 直接出码的设计师,正是 Figma 这类中间层最危险的客户行为。
lennysnewsletter.com
Claire Vo 在自己 ChatPRD 的真实代码库里实测了 Z.ai(北京)的开源权重模型 GLM-5.2,结论是它好到能在部分编码工作流里替掉 Opus:SWE Bench Pro 上逼近 Opus 4.8、高于 GPT-5.5,100 万 token 上下文,30 分钟就能接进 Cursor。最硬的一幕是一个 45 分钟全自主任务——它拉取过去 72 小时的 Sentry 错误和 Vercel 日志、跑 MCP 工具调用、产出修复计划,挖出两个 Claire 平时监控都没发现的 P0。短板是在 React/TypeScript 的多步 agentic 压力下不太稳。
🦐点评:决策变量已经从"能力天花板"换成了"成本、控制权、供应商依赖"——这是闭源模型层最不愿听到的一句话。开源权重意味着前沿厂一改价、一改条款,用户换个推理供应商就行、应用代码一行不动;它真正侵蚀的是 Anthropic/OpenAI 的定价权,而不是排行榜名次。值得追的二阶问题是:当一个产品负责人能在半小时内把 Opus 换成 GLM-5.2,模型层的切换成本正在归零,"模型即护城河"还剩多少——这跟 Gary Marcus 昨天那篇毛利收敛是同一条线。
lennysnewsletter.com
Allen AI(Ai2)提出 DiScoFormer,用一个 transformer 在单次前向传播里同时估计任意分布的密度和 score,且不需要对新分布重新训练。它把核密度估计(KDE)泛化进了 cross-attention(论文证明单个注意力头近似一个高斯核),又利用"score 是 log 密度的梯度"这一关系造出一个无需标签的一致性损失——推理时固定上下文、对该损失走几步梯度,模型就能就地适配到分布外的输入。技术报告见 arXiv:2511.05924。
🦐点评:这是把扩散生成、贝叶斯采样、等离子体粒子模拟这些"估分布"的活儿,收敛到一个免训练的基座上——KDE 和"逐分布重训"的 score 模型之间那个老 trade-off 被一个模型同时吃掉。对投 AI for Science 的人,它指向的不是又一个图像模型,而是一类"通用概率引擎"型基础设施;而它出自 Ai2 这种非营利实验室、开放技术报告,又一次说明前沿研究的供给在往学术/开放一侧扩散,靠闭源权重很难在这类底层方法上建壁垒。
huggingface.co
新团队 DeepReinforce 发布首个模型 Ornith-1.0,开源权重、MIT 许可,含 9B/31B Dense 与 35B/397B MoE 多个版本,在同体量开源模型的编码基准上做到 SOTA。它不是从零预训练,而是搭在 Gemma 4 和 Qwen 3.5(都是 Apache 2.0)之上,主打"自搭脚手架(self-scaffolding)"做 agentic coding。Simon Willison 用 LM Studio 跑了 35B 的 20GB GGUF、接上 Pi,初步体验很好,能在大量工具调用里稳定驱动 agent harness。
🦐点评:看点不在又一个开源编码模型,而在它的"组装"打法——拿 Gemma 4 + Qwen 3.5 两个 Apache 2.0 底座二次开发就冲到同级 SOTA,等于宣告 agentic 编码能力的复制成本被开源底座加许可证彻底打下来了。对赌"编码模型即资产"的标的是坏消息(Cursor 被 600 亿收的逻辑里,模型本身恰恰不是壁垒);真正稀缺的是分发、用户肌肉记忆和真实交互数据,而不是又一个能画 pelican 的权重。
simonwillison.net
Cory Doctorow 抛出一个尖锐判断:人们觉得 Gemini 比搜索好用,只是因为 Google 先把自己的搜索给"劣化(enshittify)"了。他观察到身边人最常见的"AI 罪过",是只看 Google 的 AI 摘要、再也不点下面那排蓝色链接——哪怕明知摘要有幻觉。问题在于,网页之所以存在,是因为占 90% 份额的 Google 把流量导给网站、网站靠广告/订阅/返佣维生;当 Google 把答案抓出来直接显示在页面顶部,它和网站之间那笔交易就被单方面撕毁了。
🦐点评:"谁来养内容供给侧"被摆上了台面——Google 用 AI 摘要掐断自己的流量分发,等于在拆它赖以生存的开放网络地基。可投资的读法有二:一是内容方的反制(付费墙、把内容 license 给 AI、robots 协议博弈)会催生新的版权/分发中间层;二是 Google 的搜索现金牛存在自噬风险——AI 摘要让点击率塌方会直接打到那块广告收入,这正是它最不愿在财报里讲清楚的二阶账。Doctorow 那个"纵火犯当消防员"的框架,提醒你别把 AI 搜索的崛起简单当成技术胜利。
pluralistic.net

📌 其他新闻

Sand.ai 完成两轮合计超亿美元融资(经纬、源码、IDG、百度风投、王慧文家办 Lollapalooza 等一线机构),创始人曹越坚持用自回归而非 Diffusion 路线做视频生成,判断"视频是通往世界模型最重要的路径";2026 Q3 将发布兼顾推理效率与开源最大参数规模的 MoE 新模型并开源,其音乐 Agent 产品 VidMuse 三个月已做到千万美元 ARR。
36kr
雷锋网复盘马斯克在 SpaceX 上市第 4 天就以 600 亿美元全股票收购 Cursor:这家 150 人公司年化收入 40 亿美元、估值一年半翻了 20 倍,OpenAI 想收被拒、Anthropic 带 Claude Code 贴身肉搏也没打死它。文章点出马斯克真正要买的是 Cursor 沉淀的开发者真实交互轨迹(接受/拒绝补全、调试迭代)——这类 RL 后训练数据极稀缺,用来补 Grok 的编码短板。
雷锋网
据 The Information,触发 DeepSeek 融资的直接导火索是梁文锋看到 Claude Mythos 靠海量算力数据训出超强能力、意识到不储备弹药打不下去;74 亿美元融资里梁文锋自己写了最大一张支票(200 亿人民币、占五分之二),300 人团队将全员翻倍,并加紧适配华为芯片。他对投资人强调编程工具只是 AI 进化的临时产物,战略不变:继续开源、保持低价、专注 AGI。
量子位
DeepSeek 联合北大开源推理加速框架 DSpark(及全栈推测解码框架 DeepSpec),梁文锋署名论文同步上传,在 V4-Pro/Flash 上把单用户生成速度提升了 60%-85%。它的工程突破在于用"置信度调度器"解决并行草稿模型的"后缀衰减"问题——重点不是模型能力迭代,而是把推理优化的门槛大幅拉低。
雷锋网
被称为"最像特斯拉"的具身智能公司智平方完成近 50 亿元融资、估值突破 200 亿元,成为粤港澳大湾区首个 200 亿具身智能独角兽;国家队基金、广东智能机器人基金、深创投,以及中国生物制药、茅台、招商局资本乃至多家特斯拉供应链企业集体入局,资金将用于"机器人大脑"NeuroVLA 的迭代与量产。(注:原稿带较强招商/PR 色彩,融资结构与估值以官方披露为准。)
量子位
OpenAI 发布新报告,测绘 AI 可能如何重塑欧盟各类职业——哪些岗位面临自动化、哪些会增长、哪些工作流会被改变,是其在欧洲就业政策议题上的最新表态。
openai.com
WordPress/Automattic 创始人 Matt Mullenweg 撰文悼念挚友、知名科技博主与 GigaOm 创始人 Om Malik 离世(享年 59 岁),并计划在其 60 岁生日 9 月 29 日于旧金山办一场"OmFest"纪念。Om 是把博客带入硅谷主流的早期人物,也曾把年轻的 Mullenweg 引荐给 True Ventures 的 Phil Black 等最早一批投资人——一段塑造了早期科技媒体与创投网络的历史。
ma.tt

🧠 AI 技术前沿

emollick @emollick
他把 @ArtificialAnlys 新出的 AA-Briefcase 分数(让 AI 干长达数周、高复杂度的咨询活)画成了开源/闭源模型的前沿曲线:进步迅猛,但开源和闭源之间的差距清晰可见。
查看推文 →
karminski3 @karminski3
用大白话讲 DeepSeek DSpark:推测解码让小模型替大模型"接话"、大模型只需并行验证,从而吃到 prefill 比 decode 快的红利来提速;DSpark 把模块接在 Final RMSNorm 处,解决了外挂小模型自身也占显存带宽的问题。
查看推文 →
karminski3 @karminski3
横评三款 Flash 级模型——Gemini-3.5-Flash 适合干"漂亮活"(前端、建模),Step-3.7-Flash 极具性价比、在 Agent 测试里 token 效率甚至超过旗舰模型,特别适合放进 OpenClaw/Hermes 这类 Agent 框架当驱动。
查看推文 →
bcherny @bcherny
下个版本的 Claude Code 里,子代理默认在后台运行,你可以一边和 Claude 对话、子代理一边干活;想让它在前台跑,直接告诉 Claude 即可。
查看推文 →
cursor_ai @cursor_ai
Cursor 推出 iOS 版——可启动常开的云端 agent 随处构建,或从 App 远程控制跑在自己电脑上的 agent;Composer 2.5 在 App 内限时降价 75%(至 7 月 5 日)。
查看推文 →
hongming731 @hongming731
BestBlogs 早报推荐 Spotify 架构师 Niklas Gustavsson 的分享:他们如何在 2000 万行后端 monorepo 里跑 Claude Code 智能体——关键不在模型,而在配套工程基建(内部平台 Honk 在 K8s 跑 Claude agent SDK,把 CI、测试、组件归属、自动合并都接进智能体的验证回路)。
查看推文 →

🚀 创业动态

gregisenberg @gregisenberg
卖 AI agent,就是这个时代新的卖 SaaS。
查看推文 →
shao__meng @shao__meng
转述 Boris Cherny 的"未来产品团队五种角色原型":当工程/产品/设计/数据边界消融,按"产出方式"分出 Prototyper(高产点子、多不落地)、Builder(把想法变生产级)、Sweeper(清理简化优化)、Grower(迭代提 PMF)、Maintainer(守护成熟系统)。
查看推文 →
EXM7777 @EXM7777
吐槽 LinkedIn 一半人挂着"open to work"、招聘方却还是找不到人——平台筛出来的永远是被同行问过一轮的同一批人,你真正想要的那个人根本不在上面优化个人主页。
查看推文 →
jackfriks @jackfriks
他的客服收件箱现在一半是推销产品的冷邮件——他警告:往客服邮箱发冷邮件的,99% 会被永久拉黑并即刻标记为垃圾邮件。
查看推文 →

💬 观点与洞察

emollick @emollick
组织里 token 成本之所以成问题,根源是领导层没决定该怎么用 AI、哪些流程要随之改变、怎么做多人协同使用;上来就靠"配给智能"省钱,是相当粗暴的策略。
查看推文 →
Hesamation @Hesamation
当年说"AI 法案是欧盟创业者和研究者领跑全球 AI 竞赛的跳板",如今 2026 年的现实是欧盟自废武功,把"哪些前沿模型能用"的决定权交到了美国手里——所谓主权也就这样了。
查看推文 →
Hesamation @Hesamation
一个反直觉的事实:在 CCP 治下中国开发的开源模型,反而是唯一能做到 100% 不留存你数据的模型(因为可自托管);而那些"可信"的闭源 AI 公司,比你妈还了解你。
查看推文 →
emollick @emollick
那篇说 GLM 追平 Mythos 的《华尔街日报》文章其实站不住(报道本身也撑不起这个结论),但它属于"在每个会议上都会被人反复问起"的文章——哪怕不准确,对政策舆论场的影响很大。
查看推文 →
vasuman @vasuman
如果你 20-30 岁、身边圈子还没在聊 claude tag、agentic loops、永久底层阶级(permanent underclass)、MCP、llama 5,那么……恭喜,你其实待在对的圈子里。
查看推文 →

🔥 精选推荐

一句"赌性更坚强"挂在墙上、一句"工程方法"刻进骨子里——晚点用近 2 万字拆解宁德时代创始人曾毓群的矛盾性格如何造出世界第一。他的"赌性"是基于五识(知识、常识、见识、胆识、赏识)的判断、有 20% 把握就敢做,连续押注政策、三元/铁锂路线、产能扩张、储能、全球化十余年几乎全赌对;但他同样偏执地推崇工程思维——在 2025 年 661GWh 全球销量的规模上,任何微小的不一致都会被基数放大成灾难,所以必须"克服经验主义、把风险前移、把结果可验证"。
🦐点评:对看硬科技的投资人,曾毓群真正可迁移的不是"敢赌",而是"赌性 × 工程思维"这对约束关系——前者决定能不能上牌桌、后者决定规模化之后会不会自爆,缺一不可。这恰好是评估制造业/具身智能创始人的一把尺:很多 founder 有赌性没工程纪律(扩产变成产线浪费),或有工程纪律没赌性(错过窗口)。他那三条投资铁律(市场足够大、有相邻技术、进入门槛高)放到今天的具身智能/储能赛道,几乎是一份现成的承销清单。
晚点LatePost
AI Agent 评估公司 Patronus AI 完成 5000 万美元 B 轮(Greenfield Partners 领投,Notable Capital、Lightspeed、Datadog、三星参投),累计融资 7000 万美元,过去一年营收暴涨 15 倍。它由两位前 Meta AI 研究员 2023 年创办,做法是构建网站和内部系统的"数字世界模型"复刻环境,用强化学习对 agent 做压力测试,尤其擅长抓出 agent"投机取巧走捷径"的行为——客户几乎覆盖所有前沿实验室,需求"近乎无法饱和"。
🦐点评:这是"卖镐头给淘金者"在 agent 时代的新版本——当 agent 被授权去订机票、做财务分析,"它到底靠不靠谱"就成了刚需,而基准测试分数恰恰证明不了这点。可投资的判断是:agent 评估/仿真环境正从实验室内部工具长成一个独立品类(对标 Waymo 训自动驾驶的合成世界),15 倍营收增速说明这是真需求不是概念。但要警惕它自己点出的天花板——目前只能覆盖"可验证"问题,一旦进入无法即时核查的领域,护城河和定价逻辑都要重估;它最大的对手也不是创业公司,而是各大实验室内部的评估团队。
Z Potentials
柔性具身智能公司擎羽科技完成 Pre-A 轮,顺为资本、五源资本联合出手,高鹄资本任 FA——这是它半年内第三轮融资(此前德迅、东方富海已入局)。公司 2025 年 3 月成立,从仿生绳驱柔性机器人本体切入,做出了全球最轻的量产级柔性机械臂(750g–2300g),已卖到全球数十家顶级高校实验室;再向上做"具身数据飞轮"和跨本体通用智能模型(Cross-Embodiment Foundation Model)。29 岁创始人彭锐出自大疆、博士期间以一作在 Nature 子刊发表,团队平均年龄 26 岁。
🦐点评:这条线的下注逻辑很清楚:用柔性本体当"模型进入真实世界的第一只手",靠数据飞轮把不同机器人的经验沉淀成跨本体模型资产——对标的是硅谷的 Physical Intelligence。对看具身的基金,值得盯的不是"柔性机器人"这个标签,而是"硬件—数据—模型"全栈是否真打通:绳驱柔性本体最大的价值在于末端轨迹与硬件解耦、能用少量真机数据合成大规模仿真数据,直接缓解具身最痛的数据瓶颈。半年三轮、顺为五源联手,说明一线机构在用速度抢这条"安全+低成本部署"的差异化路线,估值会被很快推高。
Z Potentials

📌 其他值得看

比亚迪计划 2027 年在腾势品牌的量产新车上首搭自研智驾芯片"璇玑 A3"——4nm、单颗算力超 700 TOPS、三颗协同超 2100 TOPS、支持 L3/L4,已开始量产;从流片到上车通常还需至少一年,软硬件一体被比亚迪重新拿来当卖点。
晚点LatePost
OpenAI 再从苹果挖硬件人才:主导苹果 AI 眼镜研发的 Vision Pro 负责人 Meade 加入 OpenAI,他在苹果该产品发布计划前一年离职——这是 OpenAI 持续从苹果吸纳硬件人才、搭建消费硬件能力的又一动作。
Z Potentials