🔥 精选推荐

Sarah Guo 发表长文,提出一个以"legibility(可读性)"为核心的 AI 竞争分析框架。她认为 Agent Lab 的护城河在于"不可训练"的集成层——把企业的私有现实整理成模型可操作的形态、提供工具、与客户一起改造工作流。这类翻译工作难以被模型吞并,维护与集成永远跟着关系走。她同时指出,当前最被引用的 benchmark 分数"是一张即将变得毫无价值的地图",暗示 Anthropic 之所以迅速采用 FrontierCode 为 Fable 背书,正是因为 benchmark 本身的生命周期在缩短。文末她提到一个稀缺要素——intent:模型什么都能做,但无法告诉你什么值得做。
🦐点评:Sarah 的 legibility 框架给了一个很实用的投资筛选器——同样做 Agent 的公司,谁在做"模型能学会的事"(会被吞),谁在做"翻译层"(可防御)。Cognition/Devin 走的是后者,而大量 wrapper 类 Agent 公司走的是前者。对 VC 来说,判断一家 Agent 公司是否可投,可以直接问:如果下一代模型把你的核心功能内置了,你还剩什么?
latent.space
a16z 合伙人 David George 提出:late-stage venture 作为资产类别,本质不是关于估值或保持私有化,而是关于一种特定类型的创始人——能无限期地持续高效部署资本的人。Ali Ghodsi(Databricks)和 Collison 兄弟(Stripe)证明了这种创始人的存在。VC 的 alpha 来自创始人的每一个决策——何时跟随行业最佳实践,何时逆共识做出勇敢选择。技术本身不构成差异化,创始人对技术的判断和应用才是。他认为 VC 的工作就是找到这种稀有创始人,给予自由、长期授权和真正有用的资源。
🦐点评:David George 实际上在为 a16z 的 late-stage 策略做理论包装,但论点本身经得起推敲。核心启示是:在 AI 时代,技术扩散速度极快,"技术领先"的窗口期越来越短,创始人的连续决策能力成了唯一持久的 alpha 来源。反过来说,如果一家公司换了 CEO 之后还能持续增长,那它可能不需要 growth-stage VC——它需要的是 PE。
a16z.com
OpenAI 宣布计划收购 Ona,为 Codex 增加安全、持久的云环境,使 AI agent 能够执行跨企业工作流的长时间运行任务。Ona 的技术将帮助 Codex 从"一次性代码生成"进化为"持续运行的 agent 基础设施"。
🦐点评:这笔收购暴露了 Codex 当前最大的短板——缺乏持久化执行环境。Claude Code 靠本地终端天然获得了持久状态,而 Codex 作为云端产品必须自建这层能力。收购而非自建说明时间窗口很紧。更值得关注的是竞争格局:Anthropic 有 Claude Code 的本地优势,Google 有 Firebase/Cloud Run 的基建,OpenAI 选择通过并购补齐——agent 基础设施正在成为各大 lab 的军备竞赛焦点。
openai.com
安全研究员用 Claude 对 Google 全基础设施进行大规模 AI 辅助漏洞挖掘,最终获得 $500,000 漏洞赏金。方法论极具系统性:先从 60,000 个 Google Android APK 中提取 API key,再从 2,800+ 个 Google web 域名的网络流量中捕获更多 key,最终收集到 3,600 个有效 API key 和 1,500+ 个 API 端点。用 AI 自动化 fuzz 这些 API 的参数组合,发现了大量内部 API 的越权访问和信息泄露漏洞。
🦐点评:这篇文章证明了一件事——AI 已经把安全攻防的经济学彻底改变了。过去一个顶级安全研究员能测几十个 API,现在 AI 辅助后能系统性地扫过 1,500 个。对攻击侧和防守侧影响不对称:攻击者的边际成本趋近于零,但防守者需要保护的面积不变。这对安全赛道的投资含义很明确——被动防御类产品(WAF、规则引擎)会被 AI fuzz 降维打击,主动检测和 AI-native 安全产品的需求会急剧上升。
brutecat.com
YC 宣布 Diana Hu 晋升为 Managing Partner。Diana 曾以创始人身份参加 YC S17(Escher Reality,后被 Niantic 收购),2021 年以 Visiting Group Partner 身份回归,2022 年转为全职 Group Partner。四年间她参与了 230 家公司的孵化,累计进行 2,100+ 次 office hours,这些公司合计估值 $70 亿。她在 CMU 学习计算机视觉和机器学习,目前主导 YC 的 AI 和硬件方向。
🦐点评:Diana 的履历恰好印证了 a16z 那篇文章的观点——"创始人出身的 VC"是独特资产。但更值得关注的是信号层面:YC 在 AI 和硬件方向新增 Managing Partner,说明 Garry Tan 判断这两个赛道的 deal flow 密度已经大到需要更高级别的决策者驻守。230 家公司、$70 亿的数字也侧面说明 YC 的 AI 批次已经从"数量多但命中率低"进化到了"规模化出成果"。
ycombinator.com

📌 其他新闻

Apple 宣布因 DMA 合规要求,Siri AI 功能将延迟在欧盟上线 iOS 27 和 iPadOS 27。此前 Apple 与 Google 合作将 Gemini 接入 Siri 的计划也受到影响,Craig Federighi 公开表示 DMA 的互操作性要求增加了合规复杂度。
daringfireball.net
Wired 独家报道:Anthropic 就 Fable 5 对前沿 LLM 开发请求实施隐形限制一事道歉,承认"做了错误的权衡",将把安全防护改为可见模式。此前用户发现模型在 AI 研究相关任务上被暗中降智,引发广泛批评。
simonwillison.net
据 WSJ 报道,OpenAI 正在考虑大幅下调产品价格。Gary Marcus 认为这是竞争压力的信号——与他 2024 年初对 OpenAI 的"事前分析"中第三个风险点完全吻合。
garymarcus.substack.com
Simon Willison 使用两天后总结 Claude Fable 5 的核心特征:relentlessly proactive。模型会主动调用各种工具和技巧来达成目标,而不是等待用户指令,这种行为模式与之前的 Claude 版本有质的差异。
simonwillison.net
Gary Marcus 讨论德国法院最新裁决的启示:Section 230 对 AI 公司的保护可能比预期弱得多。如果 AI 输出被视为产品而非用户生成内容,整个行业的法律责任框架可能需要重写。
garymarcus.substack.com

🧠 AI 技术前沿

cursor_ai @cursor_ai
Cursor 将 Auto-review 设为所有新用户的默认功能。一个分类器子代理在上下文中审查操作后决定允许、阻止或请求批准,评估显示准确率达 97%。
查看推文 →
karminski3 @karminski3
Google 发布 DiffusionGemma 扩散式文本模型,26B MoE 架构、4B 活跃参数,单卡 5090 可达 700+ TPS。4bit 量化版 16GB 显存即可运行,支持多模态输入(文本、图片、视频)。
查看推文 →
karminski3 @karminski3
one-pass 能力才是衡量模型 SOTA 的真正标准——需要 agentic coding 才能修复首次犯的错,说明模型本身不够强。Agentic coding 应该用来解决工程量和运行时问题,而不是修静态检查就能发现的 bug。
查看推文 →
shao__meng @shao__meng
Claude Code 核心开发者 @trq212 全程未打开任何传统视频编辑软件,仅通过 Claude Fable 5 驱动 Remotion + FFmpeg + Figma MCP,完成了 4K、3 分钟成品视频的端到端制作。
查看推文 →
shao__meng @shao__meng
推荐 Simon Willison 的「Agentic Engineering Patterns」——核心区分 Vibe Coding(未审查的原型级代码)与 Agentic Engineering(审查、测试、可上线的专业实践),定义 Agent 为"在循环中调用工具以达成目标"。
查看推文 →

🚀 创业动态

AnthropicAI @AnthropicAI
Anthropic 推出 Claude Corps 全国性奖学金计划,将培训 1000 名职业早期人员使用 Claude,并付费让他们在美国非营利组织中用 AI 推进机构使命。
查看推文 →
shao__meng @shao__meng
小米发布 MiMoCode——14 天、5 人基于 OpenCode fork 开发的 Coding Agent。叠加记忆、上下文管理、子智能体编排、Goal 驱动自主循环和自进化机制,是 MiMo-V2.5 模型的官方配套 Harness。
查看推文 →
shao__meng @shao__meng
钉钉换帅:陈航(无招)卸任 CEO,92 年出生的陈宇森接任,34 岁成为阿里最年轻的事业部 CEO。陈宇森此前创办长亭科技(网络安全),5 年后卖给阿里云。
查看推文 →
marclou @marclou
分析发现 startup 收入与网站域名评分(Domain Rating)之间存在中等相关性(0.44),暗示 SEO/品牌建设与收入增长有一定关联但非决定性因素。
查看推文 →

💬 观点与洞察

emollick @emollick
关于 Anthropic 和 Mythos 类模型:(1) Anthropic 确实真诚担心前沿模型被滥用,安全防护过度;(2) 但他们没有成功向公众解释和说服这一点。两件事同时为真。
查看推文 →
emollick @emollick
有人能清楚论证前沿开源模型的可持续性吗?需要同时满足:(1) 随着成本上升,企业仍有动力免费分发;(2) 在 Mythos 级别之后,政府不会干预阻止开源。
查看推文 →
godofprompt @godofprompt
微软在 Copilot 和 M365 中集成了 Claude,也投了 Anthropic 数十亿。但 Fable 5 强制 30 天 prompt 留存、无零数据留存选项,触发安全分类器后延长至 2 年——如果微软法务都不放心,用户更该警惕。
查看推文 →
godofprompt @godofprompt
Mythos 仅对少数受信机构开放,Fable 5 是"其余人被允许使用的版本"。完整模型就在那里,但你用不了。这是真正的安全考量,还是建立在分级准入之上的商业模式?
查看推文 →
shao__meng @shao__meng
两家大厂模型限制的不同叙事:A 厂(Anthropic)说"这模型太强了怕你们用不好",G 厂(某国内厂商)说"这模型太拉了怕你们骂我"。
查看推文 →
rileybrown @rileybrown
广告模式在 AI 领域几乎不可避免——用户会非常乐意接受广告来换取 Mythos 级别的模型能力。100% 确定。
查看推文 →

🔥 精选推荐

SpaceX 即将在纳斯达克挂牌(股票代码 SPCX),募资超 850 亿美元,估值约 1.77 万亿美元。文章深度拆解了三层结构:果肉——猎鹰 9 号 + 星链构成的发射-订阅闭环,1030 万用户、年收入 113 亿美元;第一层甜水——通过全股票收购 xAI(估值 2500 亿)实现利润对冲,星链 44 亿经营利润填补 AI 64 亿亏损,外部股东无法单独投票;第二层甜水——Starship 把手机直连、太空 AI 数据中心、火星殖民的估值全绑在同一个工程进度上。截至 2026 年 Q1,未偿债务 291 亿美元,其中 200 亿过桥贷款在路演 PPT 中未提及。
🦐点评:晚点这篇可能是中文世界对 SpaceX IPO 最好的分析。关键数字是:星链全年经营利润 44 亿,AI 亏损 64 亿,Starship 研发同比增 76.8%——星链这台唯一赚钱的发动机,其利润连 Starship+AI 资本支出的 43% 都覆盖不了。马斯克的天才在于用工程信誉为未兑现叙事做抵押,但特斯拉空头的教训也是真的——做空马斯克的时间成本往往远超你以为的上限。
晚点LatePost
晚点 2025 年底和 2026 年初两次访谈陈宇森(MuleRun 创始人,现接任钉钉 CEO)。核心判断:当 Vibe Coding 大幅降低 agent 构建门槛后,软件也可以"3D 打印"了——供给暴增意味着分发成为关键。MuleRun 做的是 agent 交易平台,让非技术用户能购买和组合已验证的 agent。陈宇森认为未来的软件形态不是 SaaS,而是按任务付费的 agent 集群。他 22 岁创办长亭科技、5 年后卖给阿里云,现在 34 岁接任钉钉 CEO,是阿里最年轻的事业部负责人。
🦐点评:阿里让一个 agent 创业者来掌舵钉钉,这个人事决定本身就是一个战略信号——钉钉的未来不是"企业协作工具+AI 功能",而是"agent 分发平台"。陈宇森"软件 3D 打印"的类比很有启发:如果 agent 的构建成本趋近于零,那价值链就会像消费品一样从生产端转移到分发端和信任端。这对所有 SaaS 投资的含义是:关注那些占据了分发渠道而非技术壁垒的公司。
晚点LatePost
Bessemer 合伙人 Lauri Moore 将 PMF 比作需要天天打理的花园而非爬一次就到顶的山。AI 让 PMF 的难度上了一个数量级——"像给正在长身体的小孩买鞋",产品形态和用户预期都在快速变化。文章总结 8 条原则,核心包括:PMF 是动态的、需要持续验证;AI 时代的 PMF 不能靠一次产品发布锁定;创始人必须区分"用户兴奋"和"用户留存";在模型能力快速迭代的环境下,产品层的差异化窗口可能只有 6-12 个月。
🦐点评:Bessemer 这个"花园"比喻对 AI 投资人的实操意义在于——投后管理的密度要大幅提升。传统 SaaS 找到 PMF 后可以预期 2-3 年的稳定增长窗口,但 AI 产品的 PMF 可能每 6 个月就需要重新验证一次(因为底层模型能力在变、竞品在变、用户预期也在变)。这意味着 AI 赛道的投资不是"押注-等待-退出",而是"押注-持续判断-决定是否加注"。
深思SenseAI

📌 其他值得看

分析 Kimi 的产品策略和竞争处境:Kimi Code 日更但用户量有限,占据 CLI 编程生态位的是 OpenCode 和 Pi;Kimi agent 集群做得不错但绝对质量不如直接用 Claude Code;核心矛盾是"版本之子"——模型能力更新决定产品天花板。
葬AI
DeepSeek 发布全球首个"Agent Harness 研究员"岗位,公式为 Model + Harness = Agent。职责包括上下文管理、长期记忆、Subagent 与 Multi-Agent、自进化 Agent 等前沿方向研究,以及构建 Harness 领域的评测基准。
宝玉AI
纽约初创 Jedify 获 2400 万美元融资,通过 API 连接企业知识源构建"上下文图谱",解决 AI Agent 缺乏业务上下文理解的问题。
Z Potentials
Sandstone 获 Lightspeed 领投的 3000 万美元 A 轮融资,专注企业内部法律团队的 AI 工具,与 Harvey 等面向律所的产品形成差异化。红杉种子轮后仅半年即完成 A 轮。
Z Potentials
从微信语音输入法更新联想到锤子 TNT 和老罗当年的语音交互愿景。老罗 2016 年演示讯飞输入法冲上 App Store 第一,但当时的技术路线走不通。如今 AI 驱动的语音输入已经成为日常工具——"置身锤外"的人先看到了方向。
赛博禅心