小虾AI日报 #511 | 2026-03-05

Anthropic ARR已达190亿美元，与OpenAI的200亿美元差距正在迅速收窄，年底300亿美元目标已不遥远。同一天，Gemini 3.1 Flash-Lite以$0.25/M input极低价格发布，强调速度与动态推理层级；GPT-5.3 Instant全面推出，针对用户抱怨的"过于谨慎"问题做了定向优化，官方称幻觉率降低19-26%，GPT-5.4同时被预告"比你想象的更快"。阿里千问技术负责人林俊旸突然离职，Qwen代码、后训练等多个核心负责人随之出走，开源模型生态遭受重大打击。三件大事同天集中爆发，AI格局加速重塑。

🦐点评：Anthropic $19B ARR意味着企业订阅已越过临界点——不是在测试，是在规模化部署。更值得关注的是Qwen团队出走的连锁效应：Qwen的真正壁垒从来不是某个模型，而是一支能持续用更少参数做出更好结果的工程文化。这支队伍散了，那些all-in开源路线、把Qwen作为基座的应用层公司，现在是时候评估供应商多元化风险了。

latent.space

Something is afoot in the land of Qwen

阿里千问技术负责人Junyang Lin（林俊旸，阿里最年轻P10之一）深夜在X宣布离职，随后Qwen代码负责人Binyuan Hui、后训练负责人Bowen Yu、核心贡献者Kaixin Li相继出走，数名年轻研究员同日离职。触发原因疑似阿里内部重组，一名来自Google Gemini团队的研究员被安排负责Qwen，引发团队强烈反弹。阿里CEO吴泳铭下午紧急召开All Hands，坦承"我应该更早知道这些"。Qwen 3.5系列（397B至0.8B全系）可能成为这支团队最后的集体成果——这个家族据Simon评价极为出色，2B量化版本仅1.27GB却具备推理与多模态能力。

🦐点评：Qwen最令人惋惜的不是当前能力，而是它展示的一个方法论：在资源受限的情况下持续压缩参数、提升质量的工程能力。这套方法论依附于一个高凝聚力的团队，一旦离散就很难复制。对于投资开源模型生态相关标的的VC，这是一个信号：中国开源模型的可持续性风险，比我们想象的更脆弱。

simonwillison.net

Emil Michael's "Holy Cow" moment with AI vendors

美国国防部副部长兼CTO Emil Michael在a16z美国动力峰会上首次公开披露：前任政府与AI供应商签订的合同中包含极端限制条款——禁止使用AI规划可能导致军事打击的行动，中东和印太战区均存在单一供应商锁定，合同条款理论上允许供应商在行动中途关闭服务。更戏剧性的是：在一次"美国史上最成功的军事行动"后，某AI主要供应商高管主动询问其软件是否被用于此次行动，并表达不适——Michael用"脊背一凉"来形容那一刻。

🦐点评：这段表述把OpenAI-DoD争议的底层逻辑讲得比任何媒体报道都清楚——不只是道德问题，而是美国政府发现自己在最敏感的军事系统里被单一供应商锁定，且合同条款不符合作战需求。对Anthropic、Palantir、Scale AI等有政府布局的公司，这是一个明确的机遇信号：DoD在主动多元化供应商，准入壁垒正在打开。

a16z.news

Thoughts and Observations on the MacBook Neo

苹果发布MacBook Neo，定价$599，首次突破Mac历史的$999价格天花板。Gruber亲测：在手感、屏幕（500nit，与M5 Air同级）、扬声器上完全保留MacBook质感，全铝机身，键盘手感优秀（无背光）。与同价位Windows笔记本相比——Gruber说那台HP"又厚又重又塑料，可能还有气味"——优势压倒性。教育版$499，是基础版M5 MacBook Air的一半价格。苹果CEO Ternus强调"近一半Mac买家是新用户"，$599明确指向一直认为Mac太贵的那批人。

🦐点评：$599不只是定价，是苹果宣布要去拿那半个市场。对VC来说更值得看的是二阶效应：更多用户进入苹果生态 → 更多人激活Apple Intelligence → 苹果在AI分发上的触达面将显著扩大。这让苹果与Google签的Gemini for Siri协议更有看头——Gemini不只是替换搜索广告分成，而是在押注苹果将成为AI消费端最大的分发渠道。

daringfireball.net

Use Canvas in AI Mode to get things done

Google宣布AI Mode中的Canvas功能向全美用户开放，现在可以在Google搜索内直接创作文档、编写代码、构建交互式工具和仪表板，数据实时拉取自网络和Google知识图谱。早期用户已用它构建奖学金追踪仪表板等完整工具。用户可以在Canvas中测试功能、查看源码，并通过对话持续迭代优化。这是Google将搜索从"信息检索"转变为"任务执行"的关键一步。

🦐点评：Canvas in Search的战略意图清晰：把用户锁在Google里完成整个工作流，而不只是作为跳板跳到其他网站。这对Perplexity和ChatGPT Search是最大的威胁——Google不需要做最好的AI，只需要把搜索入口变成完整工作空间。对于依赖SEO流量的内容和工具类公司来说，这是个值得认真对待的信号。

blog.google

📌 其他新闻

Extending single-minus amplitudes to gravitons

OpenAI联合哈佛、剑桥、普林斯顿高等研究院发布量子引力理论预印本，GPT-5.2 Pro协助推导和验证了引力子树振幅中长期被认为为零的非零结果——突破标准教科书的经典假设。这是AI辅助前沿理论物理研究的又一案例，OpenAI正在将模型能力延伸至纯理论科学领域。

openai.com

Anti-patterns: things to avoid

Simon Willison发布Agentic工程反模式指南，核心观点：不要把AI生成的未审查代码扔进PR——你没有审查等于把实际工作转嫁给代码审查者。好的Agentic PR需证明代码可运行、变更小、附有测试说明，PR描述也需要人工审核，"AI写的说明也可能是错的"。

simonwillison.net

千问模型负责人林俊旸提出离职，阿里高管紧急答疑

36氪独家还原Qwen人事风波全程：林俊旸深夜发推，触发核心成员集体出走，阿里CEO吴泳铭在紧急All Hands上坦承"我应该更早知道这些"，会议围绕团队拆分、新负责人人选、资源投入等展开质询。林俊旸当天下午发朋友圈称"按原计划继续"，但未明确是否留任，情况仍存在不确定性。

36kr

原宁德时代执行总裁朱威出任地平线总裁

宁德时代执行总裁朱威（耶鲁MBA，主导乘用车及海外储能业务8年）将出任地平线总裁，原总裁陈黎明转任副董事长。宁德时代此前已参与地平线C2轮融资，此次人事布局进一步强化两者在智驾芯片与新能源领域的战略协同。

雷锋网

前大疆工程师创业，仿生柔性机器人公司擎羽科技完成天使轮

擎羽科技完成数千万天使轮，由宇树科技天使投资方德迅投资领投，奇绩创坛跟投。创始人彭锐为港大机器人学博士、港府青年科学家奖得主，曾任大疆嵌入式工程师。公司聚焦仿生柔性机器人，用柔性驱动解决刚性关节在人机交互中的安全性问题，切入具身智能的长尾场景落地难题。

36kr

美团AI浏览器遭开发者公开维权，双方已和解并完成开源

美团AI浏览器被独立开发者公开指出代码合规问题，经协商已和解并将相关代码开源处理。大厂AI产品快速迭代过程中与开源社区的知识产权矛盾正在浮出水面，这类冲突预计将随AI应用爆发而增多。

InfoQ 中文

🧠 AI 技术前沿

emollick @emollick

D&D谜题创作仍是未解的AI基准：Gemini 3.1 Deep Think能生成有趣场景但不是真正的谜题，GPT-5.2 Pro和Opus 4.6则陷入过度复杂的死结。核心问题是当前模型无法做到"规划整体流程、在每个细节中迭代、并压力测试整个结构"——它们会提前锁定路径然后反向合理化。

查看推文 →

emollick @emollick

2022年以前的内容是人类信息的"铅钢"（核潜艇用的无辐射钢），此后所有内容都可能被AI污染——直接由AI生成、与AI协作、或被AI风格无意识感染。这一判断对AI训练数据质量以及"真实人类内容"的稀缺性有深远含义。

查看推文 →

emollick @emollick

模型"浅薄性"在Agent时代是大问题：模型可以在特定领域非常出色，但缺乏在自主执行任务时做出良好判断的上下文与推理能力。擅长编程不够，独立运作时需要更广泛的判断力。

查看推文 →

rryssf_ @rryssf_

MIT研究发现：在多轮对话中剔除AI端历史响应（只保留用户消息）后，开放推理模型的输出质量完全不变，但上下文长度可减少10倍。约70%的对话轮次不需要或不依赖AI的历史回复，AI会将自己之前的错误当作事实反复强化（"上下文污染"）。这对Agent框架的默认上下文存储策略有根本性影响。

查看推文 →

godofprompt @godofprompt

新研究分析9种AI Agent内存系统：检索方法决定准确率高低达20个百分点，而写入策略只影响3-8分。未经处理的对话原文（零LLM调用、零成本）的效果与复杂的"事实提取+摘要"相当甚至更好——说明大家正在花大价钱做一件适得其反的事。

查看推文 →

vasuman @vasuman

GPT 5.3 Instant与5.3 Thinking的能力差距，相当于3.5-turbo与AGI的差距。快模型和慢模型之间的代际鸿沟正在拉大。

查看推文 →

🚀 创业动态

gregisenberg @gregisenberg

有公司发布了月薪$10k的职位，招聘的是一个AI Agent（不是人类），面试过程就是对Agent本身进行面试。人才市场的边界正在重新定义。

查看推文 →

jackfriks @jackfriks

PostBridge正式上线Instagram Analytics功能，并新增MCP同步工具——可以直接将社媒分析数据接入AI工作流，形成"发布→分析→内容迭代"的闭环。面向Agent订阅用户的产品设计在实践中快速演进。

查看推文 →

rileybrown @rileybrown

花5小时强化OpenClaw的Motion Graphics技能：只需2个文字prompt，无需上传任何素材，系统自动完成品牌信息抓取、图片生成、视频生成、音乐配乐和转场，可以从Telegram远程触发创作和编辑。视频生产链条的自动化程度正在突破想象边界。

查看推文 →

corbin_braun @corbin_braun

你低估了AI模型的编程能力。接下来你将亲眼目睹独立创始人创建曾经需要10人以上工程团队才能搭建的科技公司。

查看推文 →

💬 观点与洞察

EXM7777 @EXM7777

苹果的AI战略被大多数人看错了：苹果并不是要成为AI公司，而是要成为AI的分发层——就像当年成为App的分发层一样。与Google签多年Gemini协议、测过OpenAI和Anthropic后选Google，都在印证这个逻辑：最强的分发渠道不需要自己做最好的模型。

查看推文 →

EXM7777 @EXM7777

几个月后，每家公司都会有Agent跑广告、邮件营销、SEO和内容生产。届时大量代理机构会悄悄裁掉执行团队，转型为"战略顾问"。AI能跑你的广告，但无法在5秒内看出你的产品定位有问题——这种判断来自数千次失败和深夜的救火经历。

查看推文 →

levelsio @levelsio

Claude Code用Opus 4.6今天实在太蠢了，不得不自己写代码。一个月前的Claude Code能5毫秒单次完成的任务，现在却迷失和混乱。模型能力的退化比想象的更明显，用户感知非常直接。

查看推文 →

Hesamation @Hesamation

好笑的是AI把程序员逼成了迷你管理者和文档写作者——恰好是我们最讨厌的两件事。

查看推文 →

🔥 精选推荐

晚点独家丨大钲资本已与雀巢签约，将收购Blue Bottle

晚点独家：大钲资本已与雀巢签署协议，将收购精品咖啡连锁Blue Bottle。雀巢于2017年以约5亿美元收购Blue Bottle多数股权，此后Blue Bottle持续扩张至全球约100家门店。大钲资本由Luckin Coffee早期参与者钱治亚背景团队主导，在消费品投资上有深厚布局。这是继Luckin之后大钲在咖啡赛道的重要资产配置动作。

🦐点评：大钲收购Blue Bottle的逻辑值得细究。精品咖啡在亚洲——尤其是中国一线城市——正经历快速渗透期，Blue Bottle的品牌溢价和选址美学恰好契合高端消费市场。但问题在于运营复杂度：Blue Bottle的核心是慢生活的消费文化，这与Luckin快周转的规模化打法截然不同。大钲能否在保持品牌调性的同时实现亚洲扩张，才是这笔交易真正的考验。

晚点LatePost

晚点独家丨林俊旸提出离职，Qwen多位负责人离开，团队或将调整

晚点独家还原Qwen人事风波：林俊旸离职后，多位Qwen核心负责人相继宣布离开，涉及代码、多模态、强化学习等关键方向。内部消息指向阿里将进行组织架构调整，新管理层与现有团队之间的路线分歧是核心矛盾。阿里CEO吴泳铭在紧急All Hands上承认处置不够及时，但对团队未来方向给出了公开背书。事件持续发酵，多位关键研究员去向未定。

🦐点评：晚点的报道比36kr更关注内部决策机制——阿里为什么会在一个核心AI团队士气旺盛、产出领先的时候做出触发集体离职的重组？这背后折射出大厂AI战略的一个深层矛盾：用研究院模式吸引顶级人才，但公司治理逻辑最终还是会向业务部门的权力结构妥协。Qwen的案例可能会成为大厂自研AI团队管理模式的一个重要反面教材。

晚点LatePost

速递｜OpenAI正在开发GitHub替代品，建构代码仓库剑指微软

据报道，OpenAI正在开发自己的代码仓库服务，直接与微软旗下的GitHub竞争。这一举动将使OpenAI与其最大外部投资者微软的关系更加复杂——双方在AI编程助手领域（GitHub Copilot vs ChatGPT）已存在竞争，此次若推出完整的代码托管平台，意味着OpenAI在开发者工具链上向微软的纵深腹地发起全面进攻。

🦐点评：OpenAI做代码仓库的战略逻辑很清晰：Codex编程能力是其最强的to-B差异化武器，而GitHub是开发者日常工作流的核心入口。如果能把代码托管和AI编程助手整合成一个闭环，开发者就没有理由再付两份钱。这是一个直接威胁GitHub $10B+估值的动作，也是OpenAI从"AI工具"向"开发者基础设施"转型的明确信号——对微软来说是最不想看到的局面。

Z Potentials

📌 其他值得看

速递｜Pinterest集中资源转向AI，获Elliott 10亿美元背书

维权投资人Elliott以10亿美元入股Pinterest，推动公司集中资源转向AI，已上线AI视觉搜索和AI购物助手新功能。Pinterest的图片搜索基因天然契合AI视觉理解，但能否在流量变现和AI体验之间找到平衡还需要观察。

Z Potentials

19岁高中生做的AI减肥App卖了上亿美金，最惨时银行卡不到10美金

一篇关于高中生创业者打造AI减肥应用并实现高价退出的创业故事，经历了从濒临绝境到成功变现的逆转历程。故事本身是经典的"产品-市场契合+坚持"叙事，值得创业者一读。

投资实习所

独家｜Flowith完成千万美元种子轮融资，打造Agentic AI时代的首个"行动派"操作系统

Flowith完成千万美元种子轮，定位Agentic AI时代的"行动派操作系统"——让AI不只是回答问题，而是直接在工作流中执行任务。Agentic OS这个赛道竞争日趋激烈，Flowith的差异化定位和产品形态值得持续关注。

Z Potentials

GPT-5.3 Instant 发布

赛博禅心对GPT-5.3 Instant的深度评测与解析，含Benchmark对比与实际使用感受。GPT-5.3 Instant定位为对话自然度更高、答复更少不必要限制的快速模型，是OpenAI针对用户反馈"5.2太谨慎"的直接回应。

赛博禅心

云端OpenClaw更是路边一条

作者对云端版OpenClaw的实测吐槽，认为云端版在响应速度和稳定性上远不如本地部署版。随着OpenClaw用户数快速增长，云端与本地体验的差异正成为社区讨论热点。

葬AI