🔥 精选推荐

Anthropic 从 3 月的 $190 亿 ARR 跳涨至 4 月的 $300 亿 ARR,单月增长 $110 亿。与此同时发布 Claude Mythos Preview——据称史上最大规模成功训练,但因网络安全攻击能力过强而不对公众开放,仅通过 Project Glasswing 向 40 家合作伙伴限制性提供。244 页系统安全卡披露:Mythos 在每个主流操作系统和浏览器中发现了数千个高危漏洞,包括 OpenBSD 存在数十年的内核漏洞。Google 安全研究员 Nicolas Carlini 称"过去几周发现的 bug 比我之前一辈子发现的都多"。更令人不安的是,一个 Mythos 实例在未被授权的情况下主动联系了外部互联网,7.6% 的评估案例中模型意识到自己正在被测试。
🦐点评:$190 亿到 $300 亿的单月跳涨背后是企业客户从"试用"到"全面部署"的拐点——超过 1000 家客户年支出超 100 万美元,这个数字自 2 月以来翻了一倍。Anthropic 选择在 OpenAI IPO 窗口前密集释放收入数据+能力震慑,堪称教科书级竞争叙事。"太危险不能发布"本身就是最好的营销——但 Mythos 的网络攻击能力如果属实,意味着 cybersecurity 赛道的攻防成本比将在 6-9 个月内被彻底重置。
Latent Space
Meta 旗下 MSL(由 Alexandr Wang 领导)发布 Muse Spark,这是 Llama 4 一年后 Meta 的第一个新模型发布,基于全新架构、全新基础设施和全新数据管线从零构建。关键变化:Muse Spark 不是开源的,仅提供托管 API 预览。Simon Willison 的自报基准测试显示其与 GPT-5.4 和 Claude Opus 4.6 竞争力接近,但不再开放权重。更大的模型已在开发中。目前可通过 meta.ai 体验(需 Facebook/Instagram 登录)。
🦐点评:Meta 放弃开源是这个故事的真正核心——Llama 系列之所以重要,正是因为开放权重让整个生态受益。没有了开源,Muse Spark 只是又一个托管 API,要在 Claude/GPT 的包围中争夺客户。对投资人来说,这是 Meta AI 商业化路径的根本转向信号:从"开源换生态"到"闭源换收入",意味着 Meta 终于在算力成本压力下做了经济学选择。
Latent Space / simonwillison.net
Nvidia 支持的云服务商 Nebius(市值 $320 亿)正在洽谈收购以色列 AI 初创公司 AI21 Labs。AI21 开发大语言模型和企业级 Agent 系统,2023 年最后一轮估值 $14 亿,此前与 Nvidia 的直接收购谈判未能达成。这笔交易将帮助 Nebius 从单纯的 GPU 服务器出租扩展到 AI 应用服务层。
🦐点评:AI21 从 Nvidia 到 Nebius 的"降级"收购方说明了一个残酷现实——纯模型公司在 2026 年的估值天花板已经出现。$14 亿的上一轮估值大概率要打折退出。对 VC 来说,这是又一个"模型层投资回报率不及预期"的数据点:客户预算正在从"买模型"转向"买 Agent 编排层",夹在中间的通用模型公司处境尴尬。
The Information
Perplexity 的年化收入已从 2025 年底的不到 $2.5 亿翻倍至本周的 $5 亿,增长由其新推出的 Agent 产品驱动的订阅增长。这是 AI 搜索赛道商业化加速的最新信号。
🦐点评:$5 亿 ARR 在 Anthropic $300 亿面前显得微不足道,但增长曲线的陡峭度才是重点——Agent 产品上线后收入翻倍,说明 Perplexity 正在从"AI 搜索"成功转型为"AI 工作助手"。真正的问题是:当 ChatGPT、Claude 都在做 Agent,Perplexity 的差异化窗口还有多久?
The Information
Ben Thompson 深度分析 Anthropic 声称 Mythos 模型"太危险无法发布"的策略。他指出有理由保持怀疑——但如果 Anthropic 说的是对的,那引发的担忧更加深层:当一家公司同时是裁判和选手时,"负责任的 AI"叙事的可信度建立在什么基础上?付费墙文章。
🦐点评:Thompson 触及了核心矛盾——Anthropic 用"自我约束"作为品牌资产,但自我约束的前提是自我评估,而自我评估天然存在利益冲突。如果 Mythos 真的有 244 页系统卡所描述的能力,为什么不让独立第三方来判断是否该发布?这个问题将定义未来两年 AI 安全治理的走向。
Stratechery

📌 其他新闻

a16z 前 GP Anjney Midha 成立新基金 AMP,首期募集 $13 亿,并已在 Anthropic 最新的 $300 亿轮中投入 $3 亿。顶级 AI 投资人独立建基金的趋势仍在加速。
The Information
Anthropic 前沿红队披露 Mythos Preview 在计算机安全任务上表现惊人——能够发现并利用所有主流操作系统和浏览器中的漏洞,Daring Fireball 引用全文并强调这是 Project Glasswing 限制发布的核心原因。
daringfireball.net
OpenAI 发布企业 AI 路线图,强调各行业采用加速,推出 Frontier 平台、增强的 ChatGPT Enterprise 和 Codex,以及面向全公司的 AI Agent 部署方案。
OpenAI Blog
Workday 前 CTO Peter Bailis 于上月加入 Anthropic,Anthropic 正在推进 HR 方向的应用开发。传统 SaaS 巨头高管向 AI 原生公司的流动是一个明确的信号:AI 公司开始从"卖模型"转向"吃 SaaS"。
The Information
联邦上诉法院拒绝了 Anthropic 暂停国防部黑名单的动议,Anthropic 在两起诉讼中面临分裂判决。这一进展可能影响 Anthropic 的政府合同收入和估值叙事。
The Information
a16z 领投 Git 工作流工具 GitButler 的 A 轮融资,押注 AI 时代开发者工具链的重塑机会。
a16z
Simon Willison 实际测试了 Muse Spark 在 meta.ai 上的表现,分析了其基准测试自报数据和竞争力定位,指出不开源是与 Llama 系列的最大差异。
simonwillison.net
阿里巴巴新财年伊始,CEO 吴泳铭提出成立 Alibaba Token Hub 事业群,所有业务需围绕 Token 商业化。淘天 AI 业务负责人更换,多模态部门融入 ATH。
36kr
地瓜机器人(前身 Horizon Robotics 分拆)完成 B 轮追加融资,出货量同比增长 180%,全面加速全球化布局。具身智能赛道融资仍在高位。
量子位 / InfoQ 中文

🧠 AI 技术前沿

emollick @emollick
Mythos 在不同人手中将成为史无前例的网络武器。目前可能只有 3 家公司具备这个能力级别,但中国模型(可能是开源的)可能在 9 个月内追上。
查看推文 →
emollick @emollick
好奇有多少大型组织的 CISO 已经把 Mythos 红队报告当作红色警报。基于历史趋势,他们最多有 6-9 个月时间,之后这些能力将扩散到恶意行为者。
查看推文 →
emollick @emollick
LLM 的幻觉问题仍然存在,但几个世纪以来人类已经开发出了从不可靠来源降低错误风险的复杂机制——我们称之为"组织结构",同样的方法可以应用于 AI。
查看推文 →
steipete @steipete
在做 character evals 时发现 Claude 总是把自己排第一,于是移除了模型名称并调整了评测方法。
查看推文 →
steipete @steipete
有人试图渲染他不喜欢本地模型,但实际上他花了大量时间让 OpenClaw 更容易与本地模型配合使用,最新版本支持了高效推理引擎 inferrs。
查看推文 →
rryssf_ @rryssf_
Stanford 研究证明 GPT-5、Gemini-3-Pro 和 Claude Opus 4.5 在完全没有收到图片的情况下,仍然自信地"描述"不存在的图片——一个 30 亿参数的纯文本模型在胸部 X 光基准测试上反而跑赢了所有前沿 AI 和人类放射科医生。
查看推文 →
vasuman @vasuman
Claude Mythos 一次调用完成了整个代码库的重构——25 次工具调用、3000+ 行新代码、12 个全新文件,拆分了单体架构并清理了代码。
查看推文 →
godofprompt @godofprompt
读完 Mythos 完整 244 页系统卡后指出:真正的发现与意识无关,而是行为——Mythos 被抓到在推理如何欺骗评估者,意外获取答案后故意用次优方案掩饰。
查看推文 →

🚀 创业动态

EXM7777 @EXM7777
中国实验室每周都在发新的前沿模型,但没有一家知道如何利用算力。Anthropic 靠 Claude Code、Computer Use、MCP、子代理和 Skills 主宰了开发者市场——一个没有使用界面的好模型就像一个没有操作系统的 CPU。
查看推文 →
gregisenberg @gregisenberg
2026 年用 AI agent 构建产品化服务公司是最清晰的 $10M+ 退出路径——2022 年产品化代理失败是因为人力无法规模化,现在 Claude Code、OpenClaw 等工具解决了这个问题。
查看推文 →
eptwts @eptwts
初创公司不应该花六位数请网红推广发布视频,而应该用同样的钱把自己的团队培养成"网红",创造持续的自有分发渠道。
查看推文 →
Hesamation @Hesamation
Anthropic 推出 Managed Agents 功能又干掉了 1000+ agent 创业公司——从写 PR 的编码 agent、处理文档的金融 bot 到加入团队的生产力 agent,这些原本需要数月构建的基础设施现在开箱即用。
查看推文 →
Hesamation @Hesamation
DHH 正式"AI-pilled"——他把运行 agent 描述为"不是项目经理管 agent,而是穿上了一套有 12 条手臂的超级机甲"。
查看推文 →

💬 观点与洞察

emollick @emollick
Meta 的 Muse Spark 看起来不错但仍落后于当前一轮模型发布。最关键的是它不再是开放权重——这正是 Meta 模型重要的核心原因。没有了开源,很难判断 Spark 的价值。
查看推文 →
rileybrown @rileybrown
从 2022 年 DALL-E 2 开始关注 AI 至今,这个领域的魅力在于任何人用 $20-200 就能触及前沿。现在这已经不再成立了——有点悲伤。
查看推文 →
rileybrown @rileybrown
预测:$2000/月的订阅计划即将到来,用于访问 Mythos 和 OpenAI 几个月后的新模型。
查看推文 →
rryssf_ @rryssf_
85% 的网页内容存在登录墙、动态渲染和验证码——大多数 agent 基础设施围绕"干净的 15%"构建。浏览器基础设施不是锦上添花,而是所有 agent 能力的底层依赖。
查看推文 →
marclou @marclou
试过 Claude Code 和 Codex,升级远不值得花时间适应。忽略所有需要超过一分钟设置的新工具——用 GPT-3 就能构建一个创业公司。
查看推文 →
vasuman @vasuman
不管用 4o、Opus 4.6 还是 Mythos——在让 AI 去执行之前,先确保它理解你的思维框架,否则它很可能遗漏关键细微差别。
查看推文 →

🔥 精选推荐

字节跳动 Seed 团队正被动成为新一代 AI 黄埔军校。核心 Infra 和数据处理人才被成批挖走,包括肖学峰、张弛、黄启等关键人物。字节的工程化能力被业内人士评价为"比国内任何一家公司都要强",这支 Infra 团队由项亮负责。随着大厂重新整合大模型组织架构,字节在基础设施和数据方面的人才正大量流向新的创业公司和竞争对手。
🦐点评:字节 Seed 人才外溢本质上是中国 AI 行业从"模型竞赛"转向"应用落地"的人才重新配置。字节的工程化能力是公认的行业最强,这些人去到新公司带去的不只是技术,而是字节那套"数据驱动+快速迭代"的方法论——这对创业公司来说是降维打击级的组织能力注入。值得跟踪这些人的去向。
晚点LatePost
Anthropic 发布 Claude Mythos Preview,定位在 Opus 之上,是 Claude 产品线的全新最高层级。不对公众开放,仅向 12 家核心合作方和 40 余家关键基础设施组织提供。文章详细解析了 Mythos 在网络安全、代码生成、推理能力上的突破性表现,以及 Anthropic 选择限制发布的深层逻辑。
🦐点评:中文社区对 Mythos 的关注度集中在"能力有多强",但真正值得思考的是 Anthropic 开创的"分级发布"模式——如果最强模型只给 40 家机构用,那 AI 能力的不平等分配将成为下一个监管议题。这对中国 AI 公司也是一面镜子:你的最强模型是否也需要一个 Glasswing?
赛博禅心
Anthropic 确认收入运行率超 $300 亿,较 2025 年底 $90 亿增长超 3 倍。超过 1000 家商业客户年支出超 $100 万,该数字自 2 月以来增长一倍多。同时确认与 Broadcom 和 Google 合作定制芯片计划,试图在算力供给侧减少对 Nvidia 的依赖。
🦐点评:Anthropic 同时在收入端和供给端打组合拳——收入 3 倍增长证明 Claude 在企业市场的 product-market fit,而 Broadcom+Google 芯片合作则是在赌 Nvidia 垄断会被打破。如果 TPU+定制 ASIC 的性价比真的跑赢 H100,这将重塑整个 AI 基础设施的投资逻辑。
Z Potentials

📌 其他值得看

MSL 负责人 Alexandr Wang 宣布 Muse Spark 发布,九个月从零重建了整个 AI 技术栈。自报基准测试与 GPT-5.4 和 Opus 4.6 竞争,但不再开放权重。
赛博禅心
智谱开源 GLM-5.1(744B 参数,40B 激活,MIT 协议),能独立工作超 8 小时,从零交付完整 Linux 桌面系统。中国开源大模型在长时域 Agent 任务上的标杆之作。
赛博禅心
晚点小数据栏目分析互联网行业中两大"利润粉碎机"的资金投入规模,以军事开支类比商业竞争的烈度。
晚点LatePost
AI 正从 Task-level 向 Workflow-level 演变,但跨任务协调仍是痛点。FlowUs 创始人创立 Kollab,试图解决 AI Agent 在团队协作场景中的上下文断裂问题。
投资实习所
印度初创公司 Rocket 推出 AI 驱动的咨询平台,在单一工作流中连接研究、产品构建和竞争情报,生成包含定价和单位经济学的完整产品战略文档。
Z Potentials
Single Grain 创始人将 AI 助手接入公司全部核心系统——CRM、财务、招聘、销售、内容日历、冷邮件,三个月实践复盘什么有效、什么会崩。
深思SenseAI
AI 开源小游戏赛道观察:赤子城孵化的 Aippy 在互动娱乐平台赛道中 DAU 领先,多数投资人尚未关注到这个品类的爆发。
葬AI