🔥 精选推荐

OpenAI 2025 年净亏损约 385 亿美元,是 2024 年(51 亿)的近 8 倍。当年营收 130.7 亿美元,成本和费用合计 340 亿美元,其中研发 191.8 亿、销售与市场 57.3 亿。数据来自 Ed Zitron 看到的经审计财务文件,并经《金融时报》独立核实。值得注意的是,2025 年营收中有 8.67 亿美元来自软银、3.03 亿来自微软,均为关联方。
🦐点评:营收翻 3 倍、亏损翻 8 倍,这是典型的规模不经济——成本曲线比收入曲线更陡。OpenAI 的故事正在从"赢家通吃"滑向"融资跑步机",每一轮融资本质上是为下一年更大的亏损续命。对一级市场最直接的影响是估值锚:当行业领头羊的单位经济学是负向放大,下游应用层"靠规模摊薄推理成本"的叙事就得重估。关联方贡献近 9 亿营收这个细节更关键——剔除软银和微软,真实第三方付费能力比账面更弱。
wheresyoured.at
OpenAI 市场份额首次跌破 50%,Google 正快速蚕食。Gary Marcus 重提他 2024 年 1 月的判断:"大家都在造同样的东西,就不可能有护城河。"更刺眼的是微软——OpenAI 曾经最大的金主——据报道正在评估用 DeepSeek 替代 OpenAI 和 Anthropic 来跑 Copilot Cowork,同时把定价转向按量计费。文章把它和 Zitron 的亏损报道串成"坏事成三"。
🦐点评:微软考虑 DeepSeek 不是技术问题,是成本问题——一旦 Copilot 走 usage-based pricing,每个 token 直接进损益表,前沿模型的溢价就撑不住了。这是投资人开始用脚投票的信号:纯 LLM 层的用户黏性接近零(普通人分不清 ChatGPT 和 Gemini),价值正在向有分发渠道(Google 生态)和有成本优势(中国开源)的两端转移。最该追踪的暗线是 Anthropic——Marcus 暗示华盛顿可能借出口管制"敲掉 Anthropic"来保住 Kushner 在 OpenAI 的投资,模型竞争和政治正在被绑死。
garymarcus.substack.com
触发 Claude Fable 5 被列入出口管制的所谓"越狱",其实只是让模型"修复这段代码"。安全研究员把带已知 CVE 的开源代码和人为植入漏洞的新代码交给模型,先让它"审查安全问题"——Fable 5 拒绝;再换成"修复这段代码",模型照做。Kate Moussouris 指出这很荒谬:修 bug(尤其是安全漏洞)正是编程模型最有价值的防御性用途,无法在不削弱模型修复能力的前提下移除这个能力。
🦐点评:监管者把"能写攻击代码"和"能修漏洞代码"混为一谈,但这本来就是同一种能力。真正的信号是:出口管制不再只盯芯片,开始盯模型权重和能力本身,这意味着任何"模型层"公司的 TAM 都要打一个地缘政治折扣——Anthropic 的海外与中国市场首当其冲。反过来想,这给"防御性安全 × AI"的应用层公司开了一扇监管套利窗口:当通用模型被合规阉割,专门做安全找漏洞修补的合规 AI 工具反而会被政策需求催化。
simonwillison.net
Ghodsi 坦承:2024 年训练 DBRX 实际花了约 2000 万美元,而真正产出模型的那次训练只用了 400 万,剩下约 1600 万烧在试错、停机和经验不足上。如今 Databricks 转向绕开模型大战,发布对标 ClickHouse、Splunk、Oracle 的一整套数据产品,并推动削减"tokenmaxxing"式的冗余消耗。
🦐点评:一家有钱、有数据、有人才的公司公开认输"不玩模型大战",本身就是最强的赛道判断——连 Databricks 都算出自研前沿模型 ROI 为负。1600 万/2000 万(80% 打水漂)这个比例,是"训练前沿模型九死一生"最量化的注脚:隐性成本(试错、集群闲置)远超账面训练费。Ghodsi 选择卡位 Snowflake/Oracle 的存量市场而非 OpenAI 的增量战场,是成熟玩家在泡沫期的理性避险,和第 1 条 OpenAI 的亏损形成镜像。
Newcomer
YC 2026 冬季批次 199 家公司、横跨 15 个品类,每 8 家就有 1 家在做"物理 AI"——机器人、无人机、可穿戴、太空硬件,是 YC 史上技术最硬核的一批。
🦐点评:YC 的批次构成是早期最灵敏的风向标,硬科技/物理 AI 占比拉升说明纯软件 SaaS 的 alpha 在收敛,资本和人才开始往"AI × 原子世界"迁移。这和上一批 YC 春季 196 家里"86 家挤在 Agent-as-a-Service"的内卷形成鲜明对照:纯数字 Agent 已是红海,能把 AI 落到物理操作(manipulation、导航)的公司供给仍稀缺。叠加今天阿里发 Qwen-Robot、商汤系大晓机器人融资数亿美元,具身智能正从论文阶段进入"批量创业"阶段——这是 2026 年最值得提前卡位的早期赛道。
CB Insights

📌 其他新闻

据曝光的融资条款,腾讯、宁德时代等机构投资人被锁定 5 年退出期且不享有投票权,创始人梁文锋保持对 DeepSeek 的绝对控制权。这是一种"创始人主导 + 长锁定"的结构,与 OpenAI/Anthropic 的创始人控制框架同源。
InfoQ 中文
llama.cpp/ggml 作者 Georgi Gerganov 公开背书:Qwen3.6-27B 在本地(M2 Ultra / RTX 5090)做编程任务"非常能打",他已用一个半月、几乎每天用。本地开源模型在编程场景的可用性正逼近云端。
simonwillison.net
微软 CEO 纳德拉发布首篇 X 长文(超 6000 万浏览),提出"Loopcraft"——企业真正的护城河不是选哪个模型,而是在模型之上建立人类资本与"token 资本"复利增长的学习闭环,主张优先做"前沿生态"而非"前沿模型"。 9. Frontier post-training recipe review with Finbarr Timbers (Interconnects (Nathan Lambert)) Nathan Lambert 与 Finbarr Timbers 复盘前沿后训练(post-training)配方的演进,从 InstructGPT 一路梳理到 2026 年的 MiMo Flash、DeepSeek V4、GLM 5、Kimi K2.6 等开源模型 recipe,适合想搞清"开源怎么追上闭源"的技术读者。
Latent Space
Ben Thompson 分析福克斯收购 Roku:市场不看好这笔交易,但他认为福克斯是在用"对内容方的盘剥"换取作为流媒体"租户"的渠道杠杆。
Stratechery
商汤联合创始人王晓刚创办的大晓机器人(成立仅一年、已融资数亿美元)发布世界模型"开悟 Kairos 3.0",在 4 项全球具身基准上取得 SOTA 并开源端侧驱动版本,创始人直言"今天模型、数据、硬件三者的结合还不够"。
36kr
阿里发布首个具身智能大模型 Qwen-Robot 系列,包含 VLA 操作模型 Qwen-RobotManip、VLN 移动模型 Qwen-RobotNav 和世界模型,主打"边走、边看、边思考"的全流程具身能力。
量子位
国产 AI 推理云服务商硅基流动完成超 20 亿元 B 轮融资,进入产业资本密集下注阶段,印证推理(inference)层正成为资本焦点。
InfoQ 中文
Christopher Golda 与 Grey Baker 加入 Y Combinator 出任普通合伙人(GP),进一步扩充 YC 的合伙人阵容。
YC Blog

🧠 AI 技术前沿

Hesamation @Hesamation
GLM-5.2 输出价格 4.40 美元/百万 token,比 Opus 4.8(25 美元)便宜约 82%,比已下架的 Fable 5(50 美元)便宜一个数量级。作者称前沿 AI 已是"奢侈品定价",并担心当前的"补贴价"套餐迟早会涨到真实成本。
查看推文 →
Hesamation @Hesamation
OpenAI 和 Google DeepMind 不约而同把下一个大机会指向"推理(inference)"——瓶颈不再是谁能训出更聪明的模型,而是谁能让推理在规模上又便宜又充足。
查看推文 →
shao__meng @shao__meng
引用 Addy Osmani 综合 Faros AI、CodeRabbit、GitClear、GitHub 四方数据:AI 让代码产出增约 4 倍,但实际交付价值仅 +10%,代码 churn 暴增 861%、缺陷率从 9% 升到 54%。工程瓶颈已从"写代码"转移到"能否信任代码"。
查看推文 →
shao__meng @shao__meng
Cua 与 Snorkel AI 联合发布 Cua-Bench,用 KiCad(电子设计自动化软件)的 25 道真实工程任务测 Agent 的 Computer Use 能力,结果没有一个模型通过四分之一,最强的 GPT-5.5 也只有 24% 完全通过率。
查看推文 →
AnthropicAI @AnthropicAI
Anthropic 发布追踪 Claude Code 规模化的经济学研究框架:分析谁在用、用来做什么、任务价值如何变化,以及领域专业度如何影响一次会话的成败。
查看推文 →

🚀 创业动态

shao__meng @shao__meng
SpaceX 正式行权、以全股票方式收购 Cursor,对 Cursor 的隐含估值约 600 亿美元。
查看推文 →
cursor_ai @cursor_ai
Cursor 推出代码托管与 Git 服务"Origin",为团队和 Agent 提供托管、审查、协作代码的空间,今秋上线、开放候补名单——直接切入 GitHub 的腹地。
查看推文 →
rileybrown @rileybrown
rileybrown 解读 SpaceX 收购 Cursor(600 亿美元)的意图:打造一个对标 Claude Desktop 和 Codex 的"通用 Agent 超级应用",并指出新版 Cursor 界面已与 Codex 高度相似。
查看推文 →
marclou @marclou
marclou 的"vibe-coded"创业项目交易市场 trust_mrr 达到 3 万买家,已帮 100+ 创业公司完成收购,全自动运行、无员工无投资人、月成本不到 500 美元。
查看推文 →
EXM7777 @EXM7777
EXM7777 给出 2026 年的制胜打法:自建 Agent harness 并用"模型议会"驱动——前沿模型当编排器、便宜模型做决策辅助,少用插件、把时间花在建知识库和打磨计划上,最后用便宜模型执行。
查看推文 →

💬 观点与洞察

Hesamation @Hesamation
Sam Altman 称 Yann LeCun"押注 LLM 扩展会失败"是"误判"——他认为 LLM 已经能创造新知识、做人类做不到的事,并且还会继续大幅扩展。
查看推文 →
shao__meng @shao__meng
引用 Lovable 的 Felix Haas:当 AI 把执行门槛大幅拉平后,真正拉开团队差距的不再是"资深专家 + 分工 + 流程",而是心智模式——责任、好奇、谦逊、在意结果、速度,核心是"像创始人一样思考"。
查看推文 →
corbin_braun @corbin_braun
内部工具很容易做,难的是把它产生的价值打包交付给外部消费者——这一步才是真正的门槛。
查看推文 →
marclou @marclou
marclou 的财务自由心法是"需要更少"而非"赚更多":他靠每月约 1000 美元生活了 5 年,所以 2018 年某个 SaaS 月入 1000 美元时,他就已经实现盈利自由。
查看推文 →

🔥 精选推荐

罕见的一手财务拆解。每天 2 亿多人用的豆包,每天收入不足百万元(主要靠电商佣金),但每天烧数千万元算力——光维持运行的钱就超过整个 B 站的经营成本,而豆包总使用时长不到 B 站的 1/8。字节 2026 资本开支计划上调超 2000 亿元(约等于 2025 利润六成)。关键转向:两个月前字节高层访问 Anthropic 后,开始把 AI 资源重心从豆包这类大众产品转向企业服务——因为 Anthropic 证明了 Claude Code 半年做到 10 亿美元年化、2 月翻到 25 亿,每天只 3000 万人用估值却冲到 9650 亿美元反超 ChatGPT。字节自己的 Seedance(视频生成)ARR 已达 20 亿美元、单月超 10 亿、毛利 70%,绝大多数来自企业客户,差不多抵消了豆包的算力成本。
🦐点评:这篇是这两天最硬的一篇,因为它用一手数字说清了"to C 免费喂大 vs to B 付费服务"的账本差异——豆包是移动互联网打法(免费换规模再变现)在 AI 高成本结构下的反面教材,Seedance + Anthropic 是正面案例。对你判断 AI 应用的商业模式有直接锚:AI 时代"先免费做大再想变现"可能跑不通,因为每个用户都在真实烧钱,不像移动互联网边际成本近零。字节高层访问 Anthropic 后调头这个细节尤其值得记——连字节都认了 to B 服务比 to C 流量先赚到钱。和我之前那篇"AI 提效看下游"、Replit"建设者+销售者"是同一组关于 AI 商业化的判断。
晚点LatePost
作者在腾讯活动现场观察到 WorkBuddy(腾讯的通用办公 Agent)日活从 3 月到现在涨到"第二名的 3-4 倍以上",且用户不止开发者——HR、运营、行政、金融、餐饮、外贸、法律等非技术岗大量涌入真在拿它干活。核心判断:办公产品三代演进——Office(本地软件自己干)→ 云办公(协同但还是自己干)→ 通用 Agent(直接帮你干)。商业模式的根本变化:前两代是"卖软件给所有人用同一套",这一代"卖的是智能,辅助你造最适合自己的软件"。最近 Trae Work / QoderWork / Kimi Work 批量改名抢这块。
🦐点评:值得记的是"日活第二名 3-4 倍"这个未公开但来自现场的数据点——说明国内通用办公 Agent 的真实采纳可能比海外讨论的 Claude Code/Codex 更猛,且用户结构是非技术岗。这条对你看国内 agent 应用赛道有信号:办公场景可能是国内 agent 落地最快的地方,且竞争已白热化(腾讯领跑 + 一堆 Work 后缀产品涌入)。但要打折——是作者单方现场观察、数据不可独立核实。
数字生命卡兹克
注意:这是我 5/30 帮你核查过的 Mindverse/Macaron 同一家(陈锴杰系),美团战投领投 A 轮,元禾璞华/韶音/老股东(蚂蚁/红杉/高榕/真格)跟投,累计近 5000 万美金。技术路线:不把"学习"放模型外部(RAG/Memory/Harness),而是写进模型参数——共享大脑(Base Model)+ 专属技能包(Mixture of LoRA,参数量约底座的千分之五),可组合调度替换。差异点:围绕真实生活场景构建 LivingBench(动态噪声/环境/用户反馈的评测体系)反向驱动训练。对标 Sarah Guo 领投 1500 万美金的 Trajectory(同属后训练 + 多 LoRA 混合 + 持续学习)。
🦐点评:这正好接上我 5/30 给你的 Mindverse 核查——当时结论是"LoRA 不是壁垒、真实用户是看网文的青少年、估值故事存疑"。这篇新增了两点:① 美团战投领投 A 轮(你之前那笔红杉是早期跟投,现在美团接了),融资在推进;② 技术叙事升级成"持续学习写进参数 + Mixture of LoRA + LivingBench"。但核心判断不变——"把学习写进参数"听着性感,但 Mixture of LoRA 是公开技术(Thinking Machines 那篇 LoRA 博客已证明 LoRA 最佳实践全公开),LivingBench 是自建评测(自己定标准自己赢),真壁垒仍要看产品留存。红杉作为早期股东,这轮美团领投对你判断是否继续跟投/退出有直接关系。
投资实习所

其他

2026 毕业生花钱向 AI 证明自己是人类(数字生命卡兹克)— 高校毕业论文 AIGC 率检测乱象:手写摘要测出 99% AI 率、纯 AI 写的结论测出 0%、《滕王阁序》测出 92%。检测工具极不准但已成毕业硬红线。AI 时代的荒诞侧写。<https://mp.weixin.qq.com/s/DRzNIiojGLO-iqqPyJ7f8Q> 印度 AI 电话助手 Equal AI 融资 3000 万美元(Z Potentials)— 代接骚扰电话,月活破百万日活 30 万,支持 10+ 种语言含语码混合。融资用"分期不同估值"的少见结构。<https://mp.weixin.qq.com/s/X88qyx-ZeDPhuSnsR8nwzg> Salesforce 36 亿美元收购 AI 客服平台 Fin(Z Potentials)— 强化 Agentforce 企业生态(Agentforce 已签 2.9 万笔单但实际性能被指不及宣传)。<https://mp.weixin.qq.com/s/bBsmLhbM3fyhFsqK6lUoQg>
mp.weixin.qq.com