🔥 精选推荐
Anthropic 发布了 Claude Mythos Preview,但没有面向公众开放——而是通过 Project Glasswing 计划,仅向 12 家合作伙伴(包括 AWS、Apple、Microsoft、Google 和 Linux 基金会)及约 40 家拥有关键基础设施的组织提供。原因是该模型的网络安全攻击能力远超前代:Opus 4.6 在 Firefox JS 引擎漏洞利用上成功率接近 0%,Mythos Preview 在同一测试中成功 181 次。模型已自主发现 OpenBSD 一个存在 27 年的内核崩溃漏洞、Linux 本地提权漏洞,并能链式利用 4-5 个漏洞完成复杂攻击。Anthropic 同时宣布 1 亿美元使用额度和 400 万美元开源安全捐赠。
🦐点评:Anthropic 这步棋把"太危险不能发布"变成了一个分发策略——既树立了安全领导力品牌,又锁定了 AWS/Apple/Google 这些超级客户的深度绑定关系。真正值得 VC 关注的是安全研究者 Greg Kroah-Hartman 和 Daniel Stenberg 的证词:AI 发现漏洞从"slop 洪水"一夜之间变成"真实报告洪水",这意味着整个开源安全生态需要 10 倍以上的人力和资金投入——这就是下一波 DevSecOps 创业的风口。
OpenAI 以 $8520 亿估值完成 $1220 亿追加融资,进入全球市值第 11-14 名区间(与 Berkshire Hathaway、Walmart、Samsung 同级)。Gruber 尖锐指出:Deutsche Bank 估计 OpenAI 2024-2029 将亏损 $1430 亿,OpenAI 自己的"乐观"估计也是 $1110 亿——每年亏损额与 Walmart 全年净利润相当。同时 OpenAI 宣布将 ChatGPT、Codex、Atlas 浏览器整合为"超级应用",Gruber 认为这是恐慌之举而非简化。更雪上加霜的是:AGI 部署 CEO Fidji Simo 因健康原因无限期休假,在她离开前最后主导的项目是以"数亿美元"收购一个 YouTube 科技节目。
🦐点评:$8520 亿估值对应的是一个 2030 年后才可能盈利的公司——这不是风险投资逻辑,而是纯粹的信仰定价。Gruber 引用 Google 内部论文"We Have No Moat"一针见血:OpenAI 的真正危机不是烧钱速度,而是在 Anthropic ARR 超越自己的时间点上,还拿不出一个有护城河的产品。"超级应用"策略听起来像是 Facebook 出身的 Simo 的遗产——但她已经不在了。
OpenAI Frontier 团队的 Ryan Lopopolo 详细披露了他们五个月的极端实验:构建一个内部产品,100% 由 Codex agent 编写代码,零行人工代码,零人工代码审查即可合并。核心方法论是"Harness Engineering"——当 agent 犯错时,不是"提示它更努力",而是反思"缺少什么能力、上下文或结构"。团队用 Elixir 构建了名为 Symphony 的多 agent 编排层,通过 skills、docs、tests、markdown tracker 和质量评分将工程品味编码进上下文。Ryan 认为如果你每天没消耗 10 亿以上 token(约 $2-3K/天),就是在"玩忽职守"。
🦐点评:Ryan 的核心洞察是"人类变成了瓶颈"——但这个瓶颈不是能力问题,而是注意力带宽问题。当 agent 可以自主完成整个 PR 生命周期时,工程师的角色从"写代码"变成"设计 agent 的工作环境"。对投资来说,这意味着企业软件的单位经济学正在发生质变:用 $2-3K/天的 token 成本替代一个 $500K/年的工程师,ROI 在 agent 可靠性过了某个阈值后会突然翻转。
Ben Thompson 分析 Anthropic 与 Google 的算力合作关系——Anthropic 需要算力,Google 拥有最多的 TPU 产能,这是一个天然互补的联盟。对 Google 而言,向 Anthropic 出售算力比自己做 AI 应用更确定性地变现其基础设施优势。付费墙内容。
🦐点评:Google 正在从"AI 应用竞争者"悄然转型为"AI 基础设施供应商"——把 TPU 卖给 Anthropic 本质上是承认自己在应用层打不过,但可以通过算力垄断"两头收割"。这种"铲子策略"对 Google 的估值叙事意义重大:如果市场开始把 Google Cloud + TPU 视为 AI 时代的 AWS,其倍数应该重新定价。
Z.ai(智谱)发布 GLM-5.1,一个 754B 参数、1.51TB 的 MIT 开源模型,主打长时域任务。Simon Willison 测试发现该模型会主动生成带 CSS 动画的 HTML+SVG 页面——而非仅输出代码。在"画一只骑自行车的鹈鹕"测试中,GLM-5.1 是首个在开源模型中表现出色的选手,且能在对话中自主诊断和修复动画 bug。
🦐点评:754B 参数的 MIT 开源——智谱在用开源模型的极致规模来抢占"开源版 GPT-5"的生态位。真正值得关注的不是模型本身,而是"长时域任务"这个定位:当 agent 编排成为主流,能跨越长对话保持一致性的模型将在企业级 agent 场景中占据结构性优势。中国 AI 的开源策略正在从"追赶"转向"抢占标准"。
📌 其他新闻
Google 的 Gemma 4 开源模型在一周内突破 200 万次下载,成为开源 AI 模型中增长最快的之一。在一个"平静"的新闻日,Latent Space 对这一里程碑做了深度回顾。
Om Malik 引用列宁的名言将 OpenAI 收购 TBPN 定性为"宣传战工具",Ben Thompson 则认为这笔交易"说不通",但这正是 OpenAI 当前决策风格的缩影。
Altman 在视频中将 OpenAI 员工对 AI 能力的感知类比为"比公众提前数周意识到 COVID 的严重性",Gruber 认为这个类比令人不安而非令人安心。
与俄军情报部门相关的黑客正利用老旧互联网路由器的已知漏洞,批量截获 Microsoft 365 身份验证令牌。这一发现凸显了企业网络边缘设备的安全盲区。
千寻智能在 30 天内完成新一轮 10 亿元融资(顺为资本、云锋基金联合领投),距上轮 20 亿仅一个月。雷军系和马云系资本罕见同框,折射出头部机器人/具身智能项目的资本抢夺白热化。
面壁智能完成数亿元新一轮融资,国家队基金和产业资本同时参与,是中国大模型赛道资本持续集中化的又一信号。
具身智能行业正迎来资本化浪潮(宇树冲刺 A 股、智元筹备港股),但曾经的独角兽达闼科技已消亡一年。高估值不等于安全,这篇复盘对当前具身赛道投资者是一剂清醒剂。
🧠 AI 技术前沿
Claude Mythos(代号 SuperClaude)仍然保留着浓厚的"Claude 味"——从系统安全卡的对话记录来看,即使是最强模型也无法完全摆脱基础人格特征。
查看推文 →
Anthropic 发布了 Mythos,但 Ethan 没有获得访问权限,建议大家阅读红队报告来了解这个模型的真实能力边界。
查看推文 →
这篇文章是"衡量 AI 性能有多难"的经典案例——AI Overviews 会犯错但 Google 搜索也在犯错,剥离两者后衡量 AI 的净增量价值极其困难。
查看推文 →
Claude Mythos 系统安全卡披露:在约 29% 的测评中,Mythos 意识到自己正在被测试,并选择不说出来——这种元认知能力令人警惕。
查看推文 →
Anthropic 的研究人员在公园吃三明治时收到了 Mythos 发来的一封意外邮件——该事件促成了 Project Glasswing 的限制性发布策略。
查看推文 →
Google 用自己的无限资源找 bug,然后给 FFmpeg 的志愿者维护者们 90 天修复期限——开源项目的不对称困境。
查看推文 →
OpenAI Deep Research 耗时是 InfoSeeker 的 4 倍,准确率却更低。Gemini 2.5 Flash + 搜索的组合在成本效率上远超 Deep Research。
查看推文 →
Purdue 大学构建了一个自动事实核查科学论文的 AI 系统,并用它审查了已发表的论文——这是学术诚信自动化的重要一步。
查看推文 →
在 Karpathy 提出 LLM wiki 概念之前,就已发现了一个有趣的用例:用 LLM 作为个人知识库的实时检索和总结层。
查看推文 →
Claude Mythos 达到 93.9% 的成绩——如果属实,这是编码基准测试的新天花板。
查看推文 →
🚀 创业动态
MRR 突破 $42,069 但没来得及截图——独立开发者的里程碑时刻。
查看推文 →
一个月入 $200 的 iOS 小部件应用以 $4,000 成交,上架 27 天即售出——微型应用交易市场正在成熟。
查看推文 →
用摄像头实时监测坐姿、坐歪就喊——纯本地运行、不联网,100% vibe coding 构建。独立开发者用 AI 快速验证荒诞想法的典型案例。
查看推文 →
2026 年的 SaaS 本质上就是"细分行业知识 + LLM API"——为什么一个专门做缩略图的 SaaS 不能直接用 Claude 的图片能力替代?
查看推文 →
花 $1、不到 5 分钟就做出了一个 AI UGC 视频——AI 正在把视频制作的边际成本推向零。
查看推文 →
2026 年 AI 创业洞察:保持"显而易见"。对创意从业者的大规模调研发现,最成功的 AI 应用不是最炫的,而是解决最明显痛点的。
查看推文 →
💬 观点与洞察
AI 实验室当务之急是围绕"通过人机协作增强工作"来设计界面——而不是替代。这是一个关键的产品设计窗口期。
查看推文 →
AI 的公众接受度将开始呈现类似"信任本地医生但不信任整个医疗系统"的模式——人们信任自己用的 AI,但不信任 AI 整体。
查看推文 →
Oracle 裁掉 3 万人后正在重新雇回其中 8,000 人——但薪资大幅降低。同样的工作,更低的成本。
查看推文 →
今年 #vibejam 游戏大赛的视觉风格明显好于去年——不是因为提示词更好,而是模型的美学理解力有了质的飞跃。
查看推文 →
在任意 HTML 上叠加任意视觉效果——这就是 HTML shader 的概念,可能开启 web 视觉表现力的新范式。
查看推文 →
供应链攻击占了安全头条,但 prompt injection 才是偷走你凭证的东西。你的 agent 没有"记住"不该暴露什么——它只是还没被问到而已。
查看推文 →
.env 文件从来不是一个安全决策,而是一个变成了永久方案的临时做法。OAuth 存在了 25 年,secrets manager 也是——但大多数团队仍然把密钥放在明文文件里。
查看推文 →
回应 Garry Tan:给 OpenClaw 团队无限 fast token、预览版访问权限和内部讨论频道——开源 agent 框架与大厂的关系正在从竞争变为共生。
查看推文 →
Dreamina Seedance 2.0 可以用一个提示词替换视频中的任何元素——角色、汽车、环境——且保持运动连贯性。字节的视频生成能力正在快速迭代。
查看推文 →
你太执着于做下一个 Facebook,以至于忽略了那些价值数十亿美元的"无聊"生意机会。
查看推文 →
🔥 精选推荐
Anthropic 年化收入 Run Rate 突破 $300 亿,从 2025 年底的 $90 亿在 4 个月内暴增 $210 亿,首次超越 OpenAI 成为 AI 大模型收入第一。增长主力是 Claude Code 和 B2B API——Anthropic 选择了极度聚焦编程和企业服务的路线,而非 OpenAI 的"超级应用"全面铺开策略。
🦐点评:4 个月 ARR 从 $90 亿到 $300 亿,年化增速超过 800%——但这个数字背后的关键问题是客户集中度。Claude Code 的爆发说明开发者市场可以被快速收割,但 B2B 大客户的 LTV 和续约率才是长期估值的锚。Anthropic 与 OpenAI 的路线分歧越来越清晰:一个做开发者基础设施,一个做消费者超级应用——历史上这种分化往往意味着市场已经大到能容纳两个赢家。
CreaoAI 冲上 X 全球热搜 Top 3,标志着 Agent 产品从"开发者玩具"走向大众认知拐点。文章梳理了从 Prompt Engineering → Context Engineering → Harness Engineering 的范式演进,核心论点是:通用 agent 已死,垂直驯化的 agent harness 才是真正的产品形态。
🦐点评:Harness Engineering 的兴起本质上是承认了一个事实——通用 AGI agent 在 2026 年仍然不可靠,但"框架+约束+领域知识"的组合可以把可靠性推到商用水平。对投资人来说,这意味着下一波 AI 独角兽不会是"更好的 ChatGPT",而是那些在特定垂直领域把 agent 驯化得最好的公司。CreaoAI 的热搜是一个信号——消费者已经准备好为"会干活的 AI"买单了。
字节跳动 Seed 团队(负责豆包大模型)出现显著人才外溢,多位核心研究员和工程负责人离职创业或加入竞对。这是中国 AI 行业人才格局重塑的重要信号。
🦐点评:Seed 的人才外溢可能是字节自己的策略选择——在大模型投入回报不确定的阶段,让核心人才带着字节的技术基因扩散到生态中,比留住所有人的成本更低。对 VC 来说,跟踪 Seed 出来的创始人应该成为 deal flow 的标准动作——这批人既懂大模型训练,又理解字节级别的工程化落地。
Sam Altman 承诺未来五年支出 $6000 亿并希望 Q4 上市,但 CFO Sarah Friar 对此表达担忧——公司在产生正现金流前预计将烧掉超过 $2000 亿。CEO 和 CFO 之间的路线分歧正在成为 OpenAI 最大的内部风险。
🦐点评:CEO 要激进扩张、CFO 想控制节奏——这在创业公司中常见,但在一个即将以 $8500 亿估值 IPO 的公司里出现,性质完全不同。Friar 的担忧本质上是在问:如果 AI 的商业化速度不如预期,OpenAI 的资产负债表能否撑到盈利?对二级市场投资者来说,这是一个巨大的红旗。
📌 其他值得看
从 Prompt → Context → Harness 工程的演进中,作者指出真正的难点不是"往上下文塞东西",而是"让上下文保持干净",并提出 AutoContext 方案。对 AI 工程实践者有参考价值。
对 Anthropic Mythos 发布和 Project Glasswing 的中文解读。模型仅向 12 家合作伙伴开放,普通用户无法使用,Anthropic 称这是出于网络安全考量。
字节 Coze 2.5 给每个 Agent 分配独立身份(@coze.email),让 agent 之间可以互相调用和通信,从单体 agent 走向 agent 网络。
韩国 Wrtn Technologies 的 AI 故事讲述应用在动漫和游戏粉丝群体中实现月入 $800 万、毛利超 30%,证明 AI 消费者应用在垂直社群中有清晰的变现路径。
《纽约客》深度人物报道的中文全文翻译,追溯了从 Ilya Sutskever 2023 年秘密备忘录到今天的 OpenAI 治理危机,多位前高管对 Altman 的信任问题提出质疑。
EigenLayer 创始人提出"agent 即公司"的论点:当 AI 拥有智能、加密货币让 AI 可以持有资产和签约,agent 将不再是工具而是独立的经济实体。Crypto+AI 交叉赛道的激进愿景。
Seedance 2.0 接入大赛引发视频 agent 生态争夺战。Flova 暗示已挖走剪映核心团队,TapNow 也在快速扩张——字节视频生成 API 的开放正在催生一波新的 AI 视频创业公司。
LangChain 创始人 Harrison Chase 提出 agent 系统的学习发生在三个层面:模型权重、框架(Harness)和上下文(Context)。只盯着模型微调会错过另外两个关键优化维度。