🔥 精选推荐

Vercel 首席软件官 Andrew Qu 复盘其 agent 框架 eve 的由来:团队做 vibe-coding 产品 v0 时踩了一堆现成工具解决不了的坑——切换模型/供应商、加 fallback、让 agent 运行可恢复(resumable),于是把解法沉淀成可复用的 primitives,最终组装成 eve。他提出 agent 是一种"新软件形态",filesystem agent、skills、compaction、subagent 这些一年前要自己摸索的最佳实践,正变成开箱即用的框架能力。Qu 还在推 skills.sh(让 agent skill 更易发现复用)和"agent 可读网站"的概念,认为 Vercel 自己也在"变成一个 agent"。
🦐点评:Vercel 的路径值得记——它不从模型往下打,而是从"部署网站"往上迁移到"部署 agent",把 CDN/托管时代的分发能力平移到 agent 运行时。这跟今天微信频道那篇 USV"价值会漏到模型周围一圈"是同一赌注的两面:谁掌握 agent 的运行与分发基础设施,谁不训模型也能收税。对看 infra 的人,eve、skills.sh 这类"agent 中间件"比又一个套壳应用更该盯。
latent.space
AI Engineer World's Fair 最后一天以一场"loops 之争"收尾,正好折射整场大会的核心分歧:自主软件工厂现在可行吗,还是工程纪律跟不上野心?挺 loops 的 Geoffrey Huntley(Ralph Loop 作者)和 Keycard CEO 说 loops 已成定局、"我不会再回去手写代码",验证性才是关键;质疑方 HumanLayer 的 Dex Horthy 反驳"炒作跑在纪律前面",认为该往下降一个抽象层而非往上升,Subroutine 的 Greg Pstrucha 则质疑 agentic loop 的经济可持续性——"你没法靠买更多 token 把问题编排掉"。Huntley 用了个金句:现在工程师像"火车司机,工作是让机车不脱轨"。
🦐点评:这场辩论的投资价值在于给"agent 编码"降温到可判断的粒度——挺方和反方其实都承认"loop 能跑",真正的裂缝是单位经济。Pstrucha 那句"买更多 token 编排不掉问题"直接指向:靠烧 token 换自主性的 agent 产品,毛利模型可能不成立。可操作的筛子是——看一家 agentic 编码公司别只看 demo 能跑多久,要问它每完成一个可验证任务烧多少 token、这条曲线是往下还是往上。
latent.space
前端名师 Josh W. Comeau 自述第三门课《Whimsical Animations》销量只有以往一次发布的三分之一,两门老课也同样惨淡、营收同比降 50%+,他把主因归给 AI:一是很多人怀疑开发者岗位还能不能存在几个月,不愿再花钱学新技能;二是就算想学,LLM 能提供个性化辅导,付费课程的动力被抽走。他还提到 LLM"未经同意也不付报酬地吞掉并反刍"创作者的作品。多位课程作者证实看到同样趋势。
🦐点评:这是"AI 吃软件"之外更早爆的一层——AI 正在吃"教人做软件"的生意。信号意义在于:在线教育/知识付费是最先被 LLM 直接替代的现金流,因为它卖的正是"个性化解释",而这恰是 LLM 边际成本趋零的能力。反推到投资:任何护城河="专家把知识讲清楚"的内容型公司(课程、教程、部分咨询)估值逻辑要重估;但反过来,"帮创作者对抗白嫖、做数据授权/溯源"可能长出新赛道。
simonwillison.net
a16z 的 David Ulevitch 为 America Dynamism 峰会写的纲领性长文。核心数据触目:美国曾在 64 项最关键技术中领先 60 项,如今几乎全部丢掉——中国领先 57 项,美国只剩 7 项。他把 a16z 四年前设 American Dynamism 基金的背景描述为"华盛顿与硅谷长期交恶、离岸外包与监管惰性掏空工业基础、Magnificent Seven 垄断了几乎全部市场回报",SpaceX、Palantir 当年连竞标政府合同的资格都要力争。文章强调 American Dynamism 不止于国防,而是覆盖电池、电机、化学、材料、采矿的整个"电力-工业栈"。
🦐点评:这本质是 a16z 的持仓叙事——把"投国防/能源/制造硬科技"包装成爱国叙事,用"美国 64 项技术只剩 7 项领先"制造紧迫感。对红杉这类同行,真正可操作的是那组技术竞争力数字:如果 a16z 用它做募资和 LP 沟通的锚,说明"硬科技/再工业化"主题的资本正在被政治化叙事加速,估值溢价会先到这些赛道;同时它也划出了中美科技脱钩下"哪些赛道会被政府订单托底"的地图。
a16z.news
John Gruber 追问一个反差:为什么 AI 编码最强的公司之一 Anthropic,自家 Claude Mac 客户端却是个又慢又臃肿的 Electron"废物"。他给出的答案是"内部人作祟"——负责的正是 Electron 的联合创始人兼共有者 Felix Rieseberg,"就像发现大楼里所有螺丝都被锤进墙里,然后查出监工是全球最大锤子厂的老板"。Gruber 引用 Drew Breunig 的诘问:如果 Claude Code 真能按 spec 把原生代码 ship 到各平台,为什么 Anthropic 自己还在用 Electron?
🦐点评:一条比段子更硬的信号——Anthropic 用不用自家 agent 造原生 app,是"agentic coding 到底能不能端到端交付生产级软件"的活体照妖镜;它至今不做,等于给"AI 写 90% 剩下 10% 最难"这个论点背书。对投资人:这解释了为什么"agent 生成原生跨平台 app"仍是空白——谁能真正跑通 spec→native code 的最后 10%,谁就吃掉 Electron 二十年的存量;而在那之前,别把大厂的 agentic 编码 demo 直接读成"软件工程已被自动化"。
daringfireball.net

📌 其他新闻

硅基流动(SiliconFlow)Q2 末以 18C 未商业化身份递交港交所招股书,注册用户破千万、估值两年半冲到 77 亿;但招股书露底——2025 年毛利率 −24%、每卖 1 元 token 成本 1.24 元、全年净亏 3.45 亿,是 token 价格战下"亏本卖水"的典型样本。
36kr
智能两轮出行公司 OMOWAY(目蔚科技)连续完成 A、A+ 轮各数千万美元融资,A+ 轮由宁德时代旗下 Lochpine Capital 领投,股东含红杉、真格、中金及小鹏系、比亚迪系产业基金;首款车 OMO-X 6 月首发落地印尼,上市首月即登顶当地电摩订单量第一。
36kr
谷歌靠大模型逆袭、市值一度被喊到 10 万亿,却在 AI 编程这一关键入口长期籍籍无名。文章指出中美互联网大厂在 AI coding 上集体"哑火"(Cursor/Claude Code/Codex/智谱/MiniMax 中鲜有大厂产品),而谁掌握开发者入口,谁就掌握下一代软件(含 Agent)的生产方式。
雷锋网
Agent 时代 AI 系统从训练转向高频推理,瓶颈正从算力转向网络与调度,DPU 从数据中心"可选项"变为关键角色。国产 DPU 第一股云豹智能冲刺深交所上市,把这个被低估六年、潜在千亿级的赛道推到台前(英伟达早在 2020 年收购 Mellanox 后就定下"GPU+CPU+DPU"三芯战略)。
雷锋网
阿里达摩院联合中国人民大学高瓴 AI 学院等发布首个专攻超导材料发现的 AI 智能体"ElementsClaw(元素虾)",仅用 28 个 GPU 小时就把 240 万种稳定晶体海选一遍、预测其中 6.8 万种可能是超导体,并实验证实 4 种人类此前未知的全新超导体——对比人类百年发现两千余种的效率堪称"光速交卷",全部预测数据已开放。
量子位
百曜科技发布全球首个基于 LLM-JEPA 架构的 AI 虚拟细胞世界模型 AURA CellOS,基于 3.9 亿个人类单细胞转录组训练,是目前公开报道中参数规模最大的单细胞基础模型;在预测精度、扰动建模等核心指标上达到 SOTA,试图用"虚拟细胞"改写"十年十亿美元、临床成功率不足 10%"的新药研发双十定律。
量子位
非营利组织 Current AI(2025 年巴黎 AI 行动峰会成立、已募集 4 亿美元,目标是打造 AI 的"公共选项")发布开源 AI Gap Map v0.1,深度收录 228 家机构的 421 个开源产品(266 个工具/库、85 个模型、50 个数据集、20 个硬件项目),并以 MIT 协议开放底层 1184 个 YAML 数据文件,可用 Datasette Lite 直接探索。
simonwillison.net

🧠 AI 技术前沿

shao__meng @shao__meng
阿里巴巴官宣内部全面禁用 Claude Code,作者发问:国内其他大厂会不会跟进?
查看推文 →
Hesamation @Hesamation
据 Arena 数据,解禁后的 Fable 5 模型本身并未被削弱(NOT nerfed);但在部分情况下请求仍可能被 rerouting 到 Opus 4.8,用户对此反馈不一。
查看推文 →
rileybrown @rileybrown
连用 Fable 多天后感觉它和几周前几乎是同一个模型,察觉不到明显差别——侧面反驳"被削弱"的说法。
查看推文 →
gregisenberg @gregisenberg
提醒:Fable 5 免费包含仅到 7 月 7 日,之后转按量付费(每百万 token 输入 10 美元/输出 50 美元),是 Anthropic 最贵的模型;且它消耗额度约为 Opus 的 2 倍、最多只能用到每周额度的 50%。
查看推文 →
_akhaliq @_akhaliq
分享论文《Program-as-Weights:一种面向模糊函数(fuzzy functions)的编程范式》。
查看推文 →
_akhaliq @_akhaliq
现在几乎每天通过 HF 在 Claude Code 里用 GLM 5.2,已经完全转向开源模型。
查看推文 →
Hesamation @Hesamation
一篇由 OpenAI、DeepMind、Stanford 研究者合写的必读文章:有了 AI,执行(execution)变便宜了,真正的优势在于选对问题、建立强连接、并投入真实时间。
查看推文 →
Hesamation @Hesamation
AI 推理工程(inference engineering)是各大 AI 实验室最抢手的技能之一,直接决定模型能否跑得更优化、更便宜;推荐一场相关技术演讲。
查看推文 →
karminski3 @karminski3
发布了可能是全网第一个针对大模型"复杂工程能力"的测试。
查看推文 →
EXM7777 @EXM7777
大家都在转 Karpathy 谈 vibe coding,却忽略了他更重要的一点:AI 真正的机会不是更快地写代码,而是给业务建一个"第二大脑"——过去没有代码能基于一堆事实自动搭出知识库,而 LLM 可以。
查看推文 →
hongming731 @hongming731
BestBlogs 早报:智能体自主性双轴分级、OpenAI 亿级语音 AI 架构,以及让代码变便宜的 Harness 方法论。
查看推文 →

🚀 创业动态

vasuman @vasuman
一篇长文论述私募股权(PE)为何误判了 AI 的价值增量,以及 AI 未来十年将为美国企业创造 10 万亿美元价值。
查看推文 →
shao__meng @shao__meng
拆解 Every 团队使用 Codex 的深度实践:五个背景各异的成员、五种工作流;核心价值是把"系统搭建/架构"的认知负担外包给模型,让非技术用户也能低摩擦上手(如让 Codex 夜间自动 enrich 数百条 CRM 客户记录)。
查看推文 →
corbin_braun @corbin_braun
有意思:Thumio 是单人创始(solo founder),目前已有超过 5 万用户。
查看推文 →
jackfriks @jackfriks
正在和朋友们做多款可联机的游戏,全部并入一个共享邀请/多人后端的游戏 hub,当晚做完当晚就能一起玩,之后再公开。
查看推文 →
jackfriks @jackfriks
把一段和朋友聊做游戏的对话直接发给 Fable 5,趁朋友去 Costco 买热狗的功夫,Fable 5 就凭这段对话做出了一个用热狗当弹药的坦克游戏。
查看推文 →
MengTo @MengTo
作为做过大量 UI 控件的人,这个免费开源库能省下大量时间来做精细的滑块、取色器、下拉框和无限画布,感叹居然是免费开源的。
查看推文 →
eptwts @eptwts
感慨"剪辑搬运"(clipping)是如今最容易做到日入 100 美元的方式:本质是无需转化的自然流量营销,在 TikTok/IG 上一天拿 10 万播放很容易,学会稳定起量后再接联盟营销,路径就通了。
查看推文 →
0xROAS @0xROAS
seedance 2 是个绝佳的电商独立站/dropshipping 模型,生成的广告钩子(hooks)效果炸裂。
查看推文 →
EXM7777 @EXM7777
Fable 5 + Obsidian 在 Claude Code 里搭知识库堪称疯狂:Fable 擅长长任务和 agent 编排、非常适合做研究,给出 5 个可立刻上手的工作流(如把竞品情报——内容点子、在跑的 offer、SEO/AEO——灌进 vault)。
查看推文 →

💬 观点与洞察

shao__meng @shao__meng
一位在腾讯元宝工作大半年、正迎来 last day 的匿名朋友讲了元宝的真实情况:像腾讯这种营收极稳的超大公司做 AI 需要自上而下的决心,否则容易为占位、为高管短期目标而"动作变形";作者判断国内大厂里除了字节,其他基本都缺乏把新事物做成的决心和组织力。
查看推文 →
emollick @emollick
也许比"模型能力"更重要的是:大多数人根本不拿这些系统去尝试有野心的事——很多模型作为 Google 替代、作业"帮手"已很好用;真正有影响力的,是有人把前沿 AI 用在长周期真实问题上(agentic 用法)。
查看推文 →
emollick @emollick
虽然"缺少可验证领域"确实让模型在这些空间的训练更难,但模型在非可验证领域也在快速变好;能力前沿依然参差(jagged),但比"只看可验证性"所预期的要平整得多。
查看推文 →
emollick @emollick
反复让 Claude Fable 把一个游戏做得"更 AAA",结果很有意思:在 Claude 眼里这意味着升级画面、加 boss 战和机制、加入自定义音效和配乐,一路做到 WebGL 的能力上限。
查看推文 →
corbin_braun @corbin_braun
CCTV(监控级)画质的视频已经能用 AI 复刻,而且真假难辨——这条信息该怎么用,自己掂量。
查看推文 →
rileybrown @rileybrown
对 vibecoding 与机器人/家居设备的交叉方向非常兴奋。
查看推文 →
corbin_braun @corbin_braun
在行驶的火车上用蜂窝网络配合 Fable 5 写代码——这感觉就像未来。
查看推文 →

🔥 精选推荐

对 Chamath Palihapitiya 新长文《大下沉》(The Great Descent)的解读。核心论点:继互联网把"信息/知识"的成本打到零之后,AI 正把"专业判断"也变成几乎免费——而后者量级大得多,过去需要执照、事务所、多年训练才能获得的专家判断,即将人人零成本随时召唤。作者用手机的下沉曲线类比,并指出智能比手机快一倍,是因为它同时吃两条下降曲线:硬件越来越便宜 + 模型本身越来越高效。最扎心的题眼是"如果所有人都从同一个供应商租来同一个智能,那就没有人有优势"——通用能力会白菜化,真正的护城河是那些被硬编码进日常运营、藏在老员工脑子里的隐性专属知识。
🦐点评:这篇给 VC 的判断框架是"别为通用能力付溢价"。当模型能力趋同、按 token 计价,投一个"用了最强模型"的应用毫无意义,差异化只可能来自专有数据、专有工作流和"谁为结果负责"这层。可操作的反推:稀缺的不再是"生产分析",而是"决定这份分析该拿去干嘛"——能把行业隐性知识(物流手感、风控直觉、制造流程)编码进系统的公司,比又一个套壳 copilot 更值得下注。
深思SenseAI
解读 USV 合伙人 Nick Grossman 的长文《反抗军联盟》(The Rebel Alliance)。他把主流打法称为"肥模型"(Fat Models,模型/API/编排/agent/产品全自己做,OpenAI、Anthropic 各近万亿、谷歌破 4 万亿都在下这个注),但用 IBM 被 PC 拆、微软被 web 拆、苹果被安卓拆、AWS 上长出一批百亿公司的历史,赌 agentic 这一层会重演"一体化赢家最终被上层拆成零件"。他把"模型周围那一圈"拆成正在疯狂招人的几层:编排(Orchestration)、骨架(Harness,如 Claude Code 这类 CLI)、记忆(Memory)、给 agent 用的浏览器/入口、路由、身份与支付,并抛出一个数字:写作时 agent 产生的网络流量已首次历史性超过人类。
🦐点评:要先警惕作者的屁股——USV 手里没有前沿大模型,"反抗军会赢"对他们是唯一活路而非中立判断,这点解读者自己也点破了。但赌注本身有真信号:当商用场景里前沿模型的领先被压到个位数分差、企业开始按成本挑模型甚至混用,"可随时换掉供应商"就成了硬需求,价值确实会往编排/记忆/路由/身份支付这些"布线层"漏。对投资人,这层比模型层更早期、还没有赢家,但要认清很多"反 OpenAI 生态"叙事是持仓利益驱动的。
深思SenseAI
长安汽车首席智驾官陶吉透露,全行业真正量产"一段式端到端"(传感器直接到驾驶行为的一体化模型)的车企和供应商"不到一只手",长安将在下半年量产,并已把端到端列为智能化未来战略、计划投入百亿研发。作为追赶者,陶吉三年前拒掉具身智能创业融资加入长安(因为自动驾驶仍是实现物理 AI 最快的领域),把团队从 500 人扩到 1500 人、发起"AI 基石计划"和"1:4:N"人才结构。他强调没有捷径:2025 年一季度并行测试一段式和两段式后,才选了基建要求更高、上限也更高的前者;对 VLA 也保持"没被验证超过端到端就不盲目投入"的克制。
🦐点评:这是一份难得的"传统主机厂追赶智驾"的一手样本——看点不在技术,而在国企体制下做前沿 AI 的组织约束:招人受薪资与内部公平限制、千人团队摩擦、要靠"小特区"授权才能推进。陶吉的取舍逻辑(先证明再投入、不追第一)对判断中国智驾格局有用:一段式端到端玩家会极度收敛("不到一只手"),供应链和数据壁垒让后来者很难挤进——智驾供应商赛道的整合可能比想象中更快、更集中。
晚点LatePost
阿维塔(长安控股、华为与宁德时代深度参与)6 月 30 日更新递交港交所主板上市申请。三年多时间年销量从 0 冲到 12.3 万辆(2025 年增速 99.2%),2023-2025 营收从 56.5 亿增至 256.3 亿元、年复合增长 113%,毛利率从 −3% 转正至 9.4%,经营现金流转正至 23.2 亿元。其轻资产模式突出:不自建工厂、依托长安制造,3978 名员工(55% 做研发)撑起 256 亿收入,销售费用率三年从 40.8% 降到 12.8%;海外已进 43 国、当地业务已盈利。
🦐点评:阿维塔的看点是"轻资产 + 三方分工"能不能跑成可复制的造车范式——车企出品牌与产品定义、宁德时代出电池、华为引望出智能化,人效做到同规模车企数倍。但毛利率不足 10%、单车成交价下探、招股书自认 2026 年仍可能亏损,说明它还没穿越盈利拐点,IPO 更像在竞争烈度见顶前抢窗口。对看新能源的人,真正该盯的是"华为系"上市资产的估值锚:阿维塔定价会直接影响赛力斯、引望这条链上其他标的的重估。
晚点LatePost
开源 AI 云(neocloud)Together AI 完成 8 亿美元 C 轮、估值 83 亿美元,Aramco Ventures 领投,Vista、General Catalyst、NVIDIA 等参投;16 个月前 B 轮估值还是 33 亿。公司称截至上季度年度预订额已超 11.5 亿美元,付费客户含 Cursor、Cognition、Decagon。背景是企业越来越多用"能力够用但远比封闭前沿模型便宜"的开源模型,推动过去一年行业开源模型用量增长三倍;同类 neocloud(TensorWave、Upscale AI)近期也密集融资。
🦐点评:Together AI 接受了比传闻更低的融资额(10 亿→8 亿)却拿到更高估值(75 亿→83 亿),说明在泡沫焦虑升温时,一线 neocloud 仍握有议价权。但真正的信号是"开源模型用量一年增三倍 + 客户按成本挑模型"——这既是 Together 的顺风,也是隐忧:neocloud 是重资产生意,估值依赖"算力永远紧缺"叙事,一旦推理单价被开源模型和价格战继续打下去,它比轻资产的编排/网关层(如它自己点名的 OpenRouter)更脆弱。
Z Potentials

📌 其他值得看

Meta 正制定云基础设施业务计划,拟对外出售 AI 算力与自研模型访问权限,与 AWS、Azure、Google Cloud 展开新竞争;据知情人士,方案包括把现有 AI 基础设施的闲置/富余算力卖给外部客户以创造收入。
Z Potentials
一篇带调侃的原创评论,梳理"世界模型"概念的三个阶段——LeCun、李飞飞等从学术圈引入却没统一定义,视频模型厂借"实时生成"自称世界模型,最后沦为营销标签;作者认为不少所谓世界模型"不如直接做数字人"。
葬AI
一篇 AI for Science 深度长文,探讨在 AlphaFold 掀起蛋白质结构革命之后,为 post-AGI 时代构建"生命科学引擎"的路径;强调生命科学不是纯软件系统,药物发现有实验、失败、监管和临床,AI 落地远比想象复杂。
Z Potentials
复盘亿纬锂能 25 年"不跟风"的逆周期生长。2026 年电池行业主题仍是"活着"——全固态量产一再推迟至 2028-2030 年小批量、钠离子随碳酸锂跌破 10 万元吸引力下降,同时中国最严电池安全令把安全底线从"热失控前 5 分钟报警"进一步提升。
晚点LatePost
阿里把千问输入法做成独立客户端并上线 Mac 版,免登录、免费,按右 Option 键即可在微信/钉钉/Word/VS Code 等任意应用直接语音输入并 AI 自动润色,主打"说话即成稿";本质是用输入法这个系统级入口卡位 AI 交互。 <!-- ai-daily:complete -->
Z Potentials