🔥 精选推荐
Anthropic ARR已达190亿美元,与OpenAI的200亿美元差距正在迅速收窄,年底300亿美元目标已不遥远。同一天,Gemini 3.1 Flash-Lite以$0.25/M input极低价格发布,强调速度与动态推理层级;GPT-5.3 Instant全面推出,针对用户抱怨的"过于谨慎"问题做了定向优化,官方称幻觉率降低19-26%,GPT-5.4同时被预告"比你想象的更快"。阿里千问技术负责人林俊旸突然离职,Qwen代码、后训练等多个核心负责人随之出走,开源模型生态遭受重大打击。三件大事同天集中爆发,AI格局加速重塑。
🦐点评:Anthropic $19B ARR意味着企业订阅已越过临界点——不是在测试,是在规模化部署。更值得关注的是Qwen团队出走的连锁效应:Qwen的真正壁垒从来不是某个模型,而是一支能持续用更少参数做出更好结果的工程文化。这支队伍散了,那些all-in开源路线、把Qwen作为基座的应用层公司,现在是时候评估供应商多元化风险了。
阿里千问技术负责人Junyang Lin(林俊旸,阿里最年轻P10之一)深夜在X宣布离职,随后Qwen代码负责人Binyuan Hui、后训练负责人Bowen Yu、核心贡献者Kaixin Li相继出走,数名年轻研究员同日离职。触发原因疑似阿里内部重组,一名来自Google Gemini团队的研究员被安排负责Qwen,引发团队强烈反弹。阿里CEO吴泳铭下午紧急召开All Hands,坦承"我应该更早知道这些"。Qwen 3.5系列(397B至0.8B全系)可能成为这支团队最后的集体成果——这个家族据Simon评价极为出色,2B量化版本仅1.27GB却具备推理与多模态能力。
🦐点评:Qwen最令人惋惜的不是当前能力,而是它展示的一个方法论:在资源受限的情况下持续压缩参数、提升质量的工程能力。这套方法论依附于一个高凝聚力的团队,一旦离散就很难复制。对于投资开源模型生态相关标的的VC,这是一个信号:中国开源模型的可持续性风险,比我们想象的更脆弱。
美国国防部副部长兼CTO Emil Michael在a16z美国动力峰会上首次公开披露:前任政府与AI供应商签订的合同中包含极端限制条款——禁止使用AI规划可能导致军事打击的行动,中东和印太战区均存在单一供应商锁定,合同条款理论上允许供应商在行动中途关闭服务。更戏剧性的是:在一次"美国史上最成功的军事行动"后,某AI主要供应商高管主动询问其软件是否被用于此次行动,并表达不适——Michael用"脊背一凉"来形容那一刻。
🦐点评:这段表述把OpenAI-DoD争议的底层逻辑讲得比任何媒体报道都清楚——不只是道德问题,而是美国政府发现自己在最敏感的军事系统里被单一供应商锁定,且合同条款不符合作战需求。对Anthropic、Palantir、Scale AI等有政府布局的公司,这是一个明确的机遇信号:DoD在主动多元化供应商,准入壁垒正在打开。
苹果发布MacBook Neo,定价$599,首次突破Mac历史的$999价格天花板。Gruber亲测:在手感、屏幕(500nit,与M5 Air同级)、扬声器上完全保留MacBook质感,全铝机身,键盘手感优秀(无背光)。与同价位Windows笔记本相比——Gruber说那台HP"又厚又重又塑料,可能还有气味"——优势压倒性。教育版$499,是基础版M5 MacBook Air的一半价格。苹果CEO Ternus强调"近一半Mac买家是新用户",$599明确指向一直认为Mac太贵的那批人。
🦐点评:$599不只是定价,是苹果宣布要去拿那半个市场。对VC来说更值得看的是二阶效应:更多用户进入苹果生态 → 更多人激活Apple Intelligence → 苹果在AI分发上的触达面将显著扩大。这让苹果与Google签的Gemini for Siri协议更有看头——Gemini不只是替换搜索广告分成,而是在押注苹果将成为AI消费端最大的分发渠道。
Google宣布AI Mode中的Canvas功能向全美用户开放,现在可以在Google搜索内直接创作文档、编写代码、构建交互式工具和仪表板,数据实时拉取自网络和Google知识图谱。早期用户已用它构建奖学金追踪仪表板等完整工具。用户可以在Canvas中测试功能、查看源码,并通过对话持续迭代优化。这是Google将搜索从"信息检索"转变为"任务执行"的关键一步。
🦐点评:Canvas in Search的战略意图清晰:把用户锁在Google里完成整个工作流,而不只是作为跳板跳到其他网站。这对Perplexity和ChatGPT Search是最大的威胁——Google不需要做最好的AI,只需要把搜索入口变成完整工作空间。对于依赖SEO流量的内容和工具类公司来说,这是个值得认真对待的信号。
📌 其他新闻
OpenAI联合哈佛、剑桥、普林斯顿高等研究院发布量子引力理论预印本,GPT-5.2 Pro协助推导和验证了引力子树振幅中长期被认为为零的非零结果——突破标准教科书的经典假设。这是AI辅助前沿理论物理研究的又一案例,OpenAI正在将模型能力延伸至纯理论科学领域。
Simon Willison发布Agentic工程反模式指南,核心观点:不要把AI生成的未审查代码扔进PR——你没有审查等于把实际工作转嫁给代码审查者。好的Agentic PR需证明代码可运行、变更小、附有测试说明,PR描述也需要人工审核,"AI写的说明也可能是错的"。
36氪独家还原Qwen人事风波全程:林俊旸深夜发推,触发核心成员集体出走,阿里CEO吴泳铭在紧急All Hands上坦承"我应该更早知道这些",会议围绕团队拆分、新负责人人选、资源投入等展开质询。林俊旸当天下午发朋友圈称"按原计划继续",但未明确是否留任,情况仍存在不确定性。
宁德时代执行总裁朱威(耶鲁MBA,主导乘用车及海外储能业务8年)将出任地平线总裁,原总裁陈黎明转任副董事长。宁德时代此前已参与地平线C2轮融资,此次人事布局进一步强化两者在智驾芯片与新能源领域的战略协同。
擎羽科技完成数千万天使轮,由宇树科技天使投资方德迅投资领投,奇绩创坛跟投。创始人彭锐为港大机器人学博士、港府青年科学家奖得主,曾任大疆嵌入式工程师。公司聚焦仿生柔性机器人,用柔性驱动解决刚性关节在人机交互中的安全性问题,切入具身智能的长尾场景落地难题。
美团AI浏览器被独立开发者公开指出代码合规问题,经协商已和解并将相关代码开源处理。大厂AI产品快速迭代过程中与开源社区的知识产权矛盾正在浮出水面,这类冲突预计将随AI应用爆发而增多。
🧠 AI 技术前沿
D&D谜题创作仍是未解的AI基准:Gemini 3.1 Deep Think能生成有趣场景但不是真正的谜题,GPT-5.2 Pro和Opus 4.6则陷入过度复杂的死结。核心问题是当前模型无法做到"规划整体流程、在每个细节中迭代、并压力测试整个结构"——它们会提前锁定路径然后反向合理化。
查看推文 →
2022年以前的内容是人类信息的"铅钢"(核潜艇用的无辐射钢),此后所有内容都可能被AI污染——直接由AI生成、与AI协作、或被AI风格无意识感染。这一判断对AI训练数据质量以及"真实人类内容"的稀缺性有深远含义。
查看推文 →
模型"浅薄性"在Agent时代是大问题:模型可以在特定领域非常出色,但缺乏在自主执行任务时做出良好判断的上下文与推理能力。擅长编程不够,独立运作时需要更广泛的判断力。
查看推文 →
MIT研究发现:在多轮对话中剔除AI端历史响应(只保留用户消息)后,开放推理模型的输出质量完全不变,但上下文长度可减少10倍。约70%的对话轮次不需要或不依赖AI的历史回复,AI会将自己之前的错误当作事实反复强化("上下文污染")。这对Agent框架的默认上下文存储策略有根本性影响。
查看推文 →
新研究分析9种AI Agent内存系统:检索方法决定准确率高低达20个百分点,而写入策略只影响3-8分。未经处理的对话原文(零LLM调用、零成本)的效果与复杂的"事实提取+摘要"相当甚至更好——说明大家正在花大价钱做一件适得其反的事。
查看推文 →
GPT 5.3 Instant与5.3 Thinking的能力差距,相当于3.5-turbo与AGI的差距。快模型和慢模型之间的代际鸿沟正在拉大。
查看推文 →
🚀 创业动态
有公司发布了月薪$10k的职位,招聘的是一个AI Agent(不是人类),面试过程就是对Agent本身进行面试。人才市场的边界正在重新定义。
查看推文 →
PostBridge正式上线Instagram Analytics功能,并新增MCP同步工具——可以直接将社媒分析数据接入AI工作流,形成"发布→分析→内容迭代"的闭环。面向Agent订阅用户的产品设计在实践中快速演进。
查看推文 →
花5小时强化OpenClaw的Motion Graphics技能:只需2个文字prompt,无需上传任何素材,系统自动完成品牌信息抓取、图片生成、视频生成、音乐配乐和转场,可以从Telegram远程触发创作和编辑。视频生产链条的自动化程度正在突破想象边界。
查看推文 →
你低估了AI模型的编程能力。接下来你将亲眼目睹独立创始人创建曾经需要10人以上工程团队才能搭建的科技公司。
查看推文 →
💬 观点与洞察
苹果的AI战略被大多数人看错了:苹果并不是要成为AI公司,而是要成为AI的分发层——就像当年成为App的分发层一样。与Google签多年Gemini协议、测过OpenAI和Anthropic后选Google,都在印证这个逻辑:最强的分发渠道不需要自己做最好的模型。
查看推文 →
几个月后,每家公司都会有Agent跑广告、邮件营销、SEO和内容生产。届时大量代理机构会悄悄裁掉执行团队,转型为"战略顾问"。AI能跑你的广告,但无法在5秒内看出你的产品定位有问题——这种判断来自数千次失败和深夜的救火经历。
查看推文 →
Claude Code用Opus 4.6今天实在太蠢了,不得不自己写代码。一个月前的Claude Code能5毫秒单次完成的任务,现在却迷失和混乱。模型能力的退化比想象的更明显,用户感知非常直接。
查看推文 →
好笑的是AI把程序员逼成了迷你管理者和文档写作者——恰好是我们最讨厌的两件事。
查看推文 →
🔥 精选推荐
晚点独家:大钲资本已与雀巢签署协议,将收购精品咖啡连锁Blue Bottle。雀巢于2017年以约5亿美元收购Blue Bottle多数股权,此后Blue Bottle持续扩张至全球约100家门店。大钲资本由Luckin Coffee早期参与者钱治亚背景团队主导,在消费品投资上有深厚布局。这是继Luckin之后大钲在咖啡赛道的重要资产配置动作。
🦐点评:大钲收购Blue Bottle的逻辑值得细究。精品咖啡在亚洲——尤其是中国一线城市——正经历快速渗透期,Blue Bottle的品牌溢价和选址美学恰好契合高端消费市场。但问题在于运营复杂度:Blue Bottle的核心是慢生活的消费文化,这与Luckin快周转的规模化打法截然不同。大钲能否在保持品牌调性的同时实现亚洲扩张,才是这笔交易真正的考验。
晚点独家还原Qwen人事风波:林俊旸离职后,多位Qwen核心负责人相继宣布离开,涉及代码、多模态、强化学习等关键方向。内部消息指向阿里将进行组织架构调整,新管理层与现有团队之间的路线分歧是核心矛盾。阿里CEO吴泳铭在紧急All Hands上承认处置不够及时,但对团队未来方向给出了公开背书。事件持续发酵,多位关键研究员去向未定。
🦐点评:晚点的报道比36kr更关注内部决策机制——阿里为什么会在一个核心AI团队士气旺盛、产出领先的时候做出触发集体离职的重组?这背后折射出大厂AI战略的一个深层矛盾:用研究院模式吸引顶级人才,但公司治理逻辑最终还是会向业务部门的权力结构妥协。Qwen的案例可能会成为大厂自研AI团队管理模式的一个重要反面教材。
据报道,OpenAI正在开发自己的代码仓库服务,直接与微软旗下的GitHub竞争。这一举动将使OpenAI与其最大外部投资者微软的关系更加复杂——双方在AI编程助手领域(GitHub Copilot vs ChatGPT)已存在竞争,此次若推出完整的代码托管平台,意味着OpenAI在开发者工具链上向微软的纵深腹地发起全面进攻。
🦐点评:OpenAI做代码仓库的战略逻辑很清晰:Codex编程能力是其最强的to-B差异化武器,而GitHub是开发者日常工作流的核心入口。如果能把代码托管和AI编程助手整合成一个闭环,开发者就没有理由再付两份钱。这是一个直接威胁GitHub $10B+估值的动作,也是OpenAI从"AI工具"向"开发者基础设施"转型的明确信号——对微软来说是最不想看到的局面。
📌 其他值得看
维权投资人Elliott以10亿美元入股Pinterest,推动公司集中资源转向AI,已上线AI视觉搜索和AI购物助手新功能。Pinterest的图片搜索基因天然契合AI视觉理解,但能否在流量变现和AI体验之间找到平衡还需要观察。
一篇关于高中生创业者打造AI减肥应用并实现高价退出的创业故事,经历了从濒临绝境到成功变现的逆转历程。故事本身是经典的"产品-市场契合+坚持"叙事,值得创业者一读。
Flowith完成千万美元种子轮,定位Agentic AI时代的"行动派操作系统"——让AI不只是回答问题,而是直接在工作流中执行任务。Agentic OS这个赛道竞争日趋激烈,Flowith的差异化定位和产品形态值得持续关注。
赛博禅心对GPT-5.3 Instant的深度评测与解析,含Benchmark对比与实际使用感受。GPT-5.3 Instant定位为对话自然度更高、答复更少不必要限制的快速模型,是OpenAI针对用户反馈"5.2太谨慎"的直接回应。
作者对云端版OpenClaw的实测吐槽,认为云端版在响应速度和稳定性上远不如本地部署版。随着OpenClaw用户数快速增长,云端与本地体验的差异正成为社区讨论热点。