小虾AI日报 #628 | 2026-06-30

5 个人、10 周、零文档，从 0 代码做到一线发布——Gusto CTO Eddie Kim 亲自带 3 名工程师 + 1 名设计师，用 Claude Code 造出了全新 AI 产品 Gusto Cofounder（Gusto 主业刚过 10 亿美元营收、服务 50 万+小企业）。他们几乎扔掉了所有流程：没有 Figma、Jira、文档，用"垃圾桶法"——把一个完整 PR 写出来、评审、再删掉，当成产品决策而非写规划文档；用一个常开的"永久 Zoom"取代站会、复盘和 Slack；一名没有工程背景的设计师靠 Claude Code 冲到了出码效率的第 94 百分位。

🦐点评：真正的信号不是"AI 提效"，而是产品组织的最小可行单位正在坍缩——一条产品线 10 周做完，过去要 30 人团队加一个季度。对看 B2B SaaS 的基金，这逼着重估两件事：一是早期团队的人效基准被重画，5 个人能干的活不该再按 5 人估值；二是"流程型"工具（Jira/Figma/文档协作）的需求侧正在被"写完即弃的 PR"这种新工作流侵蚀——那个不用 Figma 直接出码的设计师，正是 Figma 这类中间层最危险的客户行为。

lennysnewsletter.com

🎙️ How I AI: GLM-5.2 review & How Gusto built a new product line with Claude Code

Claire Vo 在自己 ChatPRD 的真实代码库里实测了 Z.ai（北京）的开源权重模型 GLM-5.2，结论是它好到能在部分编码工作流里替掉 Opus：SWE Bench Pro 上逼近 Opus 4.8、高于 GPT-5.5，100 万 token 上下文，30 分钟就能接进 Cursor。最硬的一幕是一个 45 分钟全自主任务——它拉取过去 72 小时的 Sentry 错误和 Vercel 日志、跑 MCP 工具调用、产出修复计划，挖出两个 Claire 平时监控都没发现的 P0。短板是在 React/TypeScript 的多步 agentic 压力下不太稳。

🦐点评：决策变量已经从"能力天花板"换成了"成本、控制权、供应商依赖"——这是闭源模型层最不愿听到的一句话。开源权重意味着前沿厂一改价、一改条款，用户换个推理供应商就行、应用代码一行不动；它真正侵蚀的是 Anthropic/OpenAI 的定价权，而不是排行榜名次。值得追的二阶问题是：当一个产品负责人能在半小时内把 Opus 换成 GLM-5.2，模型层的切换成本正在归零，"模型即护城河"还剩多少——这跟 Gary Marcus 昨天那篇毛利收敛是同一条线。

lennysnewsletter.com

DiScoFormer: One transformer for density and score, across distributions

Allen AI（Ai2）提出 DiScoFormer，用一个 transformer 在单次前向传播里同时估计任意分布的密度和 score，且不需要对新分布重新训练。它把核密度估计（KDE）泛化进了 cross-attention（论文证明单个注意力头近似一个高斯核），又利用"score 是 log 密度的梯度"这一关系造出一个无需标签的一致性损失——推理时固定上下文、对该损失走几步梯度，模型就能就地适配到分布外的输入。技术报告见 arXiv:2511.05924。

🦐点评：这是把扩散生成、贝叶斯采样、等离子体粒子模拟这些"估分布"的活儿，收敛到一个免训练的基座上——KDE 和"逐分布重训"的 score 模型之间那个老 trade-off 被一个模型同时吃掉。对投 AI for Science 的人，它指向的不是又一个图像模型，而是一类"通用概率引擎"型基础设施；而它出自 Ai2 这种非营利实验室、开放技术报告，又一次说明前沿研究的供给在往学术/开放一侧扩散，靠闭源权重很难在这类底层方法上建壁垒。

huggingface.co

Ornith-1.0: Self-Scaffolding LLMs for Agentic Coding

新团队 DeepReinforce 发布首个模型 Ornith-1.0，开源权重、MIT 许可，含 9B/31B Dense 与 35B/397B MoE 多个版本，在同体量开源模型的编码基准上做到 SOTA。它不是从零预训练，而是搭在 Gemma 4 和 Qwen 3.5（都是 Apache 2.0）之上，主打"自搭脚手架（self-scaffolding）"做 agentic coding。Simon Willison 用 LM Studio 跑了 35B 的 20GB GGUF、接上 Pi，初步体验很好，能在大量工具调用里稳定驱动 agent harness。

🦐点评：看点不在又一个开源编码模型，而在它的"组装"打法——拿 Gemma 4 + Qwen 3.5 两个 Apache 2.0 底座二次开发就冲到同级 SOTA，等于宣告 agentic 编码能力的复制成本被开源底座加许可证彻底打下来了。对赌"编码模型即资产"的标的是坏消息（Cursor 被 600 亿收的逻辑里，模型本身恰恰不是壁垒）；真正稀缺的是分发、用户肌肉记忆和真实交互数据，而不是又一个能画 pelican 的权重。

simonwillison.net

Gemini is better than search because Google enshittified search

Cory Doctorow 抛出一个尖锐判断：人们觉得 Gemini 比搜索好用，只是因为 Google 先把自己的搜索给"劣化（enshittify）"了。他观察到身边人最常见的"AI 罪过"，是只看 Google 的 AI 摘要、再也不点下面那排蓝色链接——哪怕明知摘要有幻觉。问题在于，网页之所以存在，是因为占 90% 份额的 Google 把流量导给网站、网站靠广告/订阅/返佣维生；当 Google 把答案抓出来直接显示在页面顶部，它和网站之间那笔交易就被单方面撕毁了。

🦐点评："谁来养内容供给侧"被摆上了台面——Google 用 AI 摘要掐断自己的流量分发，等于在拆它赖以生存的开放网络地基。可投资的读法有二：一是内容方的反制（付费墙、把内容 license 给 AI、robots 协议博弈）会催生新的版权/分发中间层；二是 Google 的搜索现金牛存在自噬风险——AI 摘要让点击率塌方会直接打到那块广告收入，这正是它最不愿在财报里讲清楚的二阶账。Doctorow 那个"纵火犯当消防员"的框架，提醒你别把 AI 搜索的崛起简单当成技术胜利。

pluralistic.net

📌 其他新闻

独家｜获超亿美元融资，Sand.ai 曹越：为什么视频是通往世界模型最重要的路径

Sand.ai 完成两轮合计超亿美元融资（经纬、源码、IDG、百度风投、王慧文家办 Lollapalooza 等一线机构），创始人曹越坚持用自回归而非 Diffusion 路线做视频生成，判断"视频是通往世界模型最重要的路径"；2026 Q3 将发布兼顾推理效率与开源最大参数规模的 MoE 新模型并开源，其音乐 Agent 产品 VidMuse 三个月已做到千万美元 ARR。

36kr

市场份额从41%掉到26%，Cursor凭什么还值600亿？

雷锋网复盘马斯克在 SpaceX 上市第 4 天就以 600 亿美元全股票收购 Cursor：这家 150 人公司年化收入 40 亿美元、估值一年半翻了 20 倍，OpenAI 想收被拒、Anthropic 带 Claude Code 贴身肉搏也没打死它。文章点出马斯克真正要买的是 Cursor 沉淀的开发者真实交互轨迹（接受/拒绝补全、调试迭代）——这类 RL 后训练数据极稀缺，用来补 Grok 的编码短板。

雷锋网

Claude Mythos让梁文锋决定融资

据 The Information，触发 DeepSeek 融资的直接导火索是梁文锋看到 Claude Mythos 靠海量算力数据训出超强能力、意识到不储备弹药打不下去；74 亿美元融资里梁文锋自己写了最大一张支票（200 亿人民币、占五分之二），300 人团队将全员翻倍，并加紧适配华为芯片。他对投资人强调编程工具只是 AI 进化的临时产物，战略不变：继续开源、保持低价、专注 AGI。

量子位

单用户提速 60-85%！DeepSeek 联手北大开源 DSpark，突破推理加速工程问题

DeepSeek 联合北大开源推理加速框架 DSpark（及全栈推测解码框架 DeepSpec），梁文锋署名论文同步上传，在 V4-Pro/Flash 上把单用户生成速度提升了 60%-85%。它的工程突破在于用"置信度调度器"解决并行草稿模型的"后缀衰减"问题——重点不是模型能力迭代，而是把推理优化的门槛大幅拉低。

雷锋网

国家队+千亿产业+头部财投集体入局，智平方200亿估值筑就大湾区具身智能名片

被称为"最像特斯拉"的具身智能公司智平方完成近 50 亿元融资、估值突破 200 亿元，成为粤港澳大湾区首个 200 亿具身智能独角兽；国家队基金、广东智能机器人基金、深创投，以及中国生物制药、茅台、招商局资本乃至多家特斯拉供应链企业集体入局，资金将用于"机器人大脑"NeuroVLA 的迭代与量产。（注：原稿带较强招商/PR 色彩，融资结构与估值以官方披露为准。）

量子位

Mapping Europe's AI Workforce Opportunity

OpenAI 发布新报告，测绘 AI 可能如何重塑欧盟各类职业——哪些岗位面临自动化、哪些会增长、哪些工作流会被改变，是其在欧洲就业政策议题上的最新表态。

openai.com

Matt Mullenweg: 'All Roads Lead to Om'

WordPress/Automattic 创始人 Matt Mullenweg 撰文悼念挚友、知名科技博主与 GigaOm 创始人 Om Malik 离世（享年 59 岁），并计划在其 60 岁生日 9 月 29 日于旧金山办一场"OmFest"纪念。Om 是把博客带入硅谷主流的早期人物，也曾把年轻的 Mullenweg 引荐给 True Ventures 的 Phil Black 等最早一批投资人——一段塑造了早期科技媒体与创投网络的历史。

ma.tt

🧠 AI 技术前沿

emollick @emollick

他把 @ArtificialAnlys 新出的 AA-Briefcase 分数（让 AI 干长达数周、高复杂度的咨询活）画成了开源/闭源模型的前沿曲线：进步迅猛，但开源和闭源之间的差距清晰可见。

🔥 精选推荐

📌 其他新闻

🧠 AI 技术前沿

🚀 创业动态

💬 观点与洞察

🔥 精选推荐

📌 其他值得看