🔥 精选推荐
a16z 最新双年度消费 AI 榜单揭示格局加速分化:ChatGPT 仍领跑,但 Claude 付费订阅 YoY 增速超 200%、Gemini 超 258%,约 20% 的 ChatGPT 周活用户同周也在用 Gemini,多平台并存成常态。Notion AI 付费附加率一年内从 20% 跃升至 50%,AI 功能已贡献约半数 ARR——「AI 即产品」从愿景变成现实。本期首次将 CapCut(7.36 亿月活)、Canva 纳入,理由是 AI 已是其核心体验,这一口径调整使榜单更能反映真实 AI 渗透规模。全球市场已分裂为三极:西方(ChatGPT/Claude/Gemini 共享用户基础)、中国(Doubao/Kimi/DeepSeek)、俄罗斯(Yandex Alice/Sber);人均 AI 使用率第一是新加坡,美国仅第 20 名。ChatGPT 与 Claude 战略路线加速分叉:ChatGPT 已有 85+ Travel/Shopping/Health 垂类 App,目标做消费超级 App;Claude 独家连接器集中在金融数据终端(PitchBook、FactSet、MSCI)和开发者基础设施,专攻高付费 power user。
🦐点评:Manus 被 Meta 22 亿美元收购、OpenClaw 被 OpenAI 收购,两笔收购都被 a16z 点名——水平 Agent 消费化拐点已到,但这也意味着独立 Agent 公司的独立上市窗口正在快速关闭。更值得关注的信号:ChatGPT 在推交易类 App(订机票、订外卖),这是在抢支付层的入口;谁拿到消费者的「行动入口」,谁就是下一个 Google 级别的广告平台。
瑞典《每日新闻报》与《哥德堡邮报》联合调查揭露:Meta AI 智能眼镜背后有一支驻扎内罗毕的低薪承包商团队,负责实时审核用户视频流——内容包括银行账户信息、裸露画面,以及用户显然未意识到正在被录制的私密场景。受访工作人员表示「我们看到一切」,对所接触内容感到强烈不安。Meta 在广告中将眼镜包装为隐私友好的全能助手,但实际上视觉数据持续传入后端系统、由人工标注。
🦐点评:可穿戴 AI 的商业模式悖论在此完全暴露——「无感体验」是产品卖点,但无感恰恰意味着用户对数据采集没有感知。欧盟 GDPR 早晚会来收拾,但监管时差让 Meta 已建立了数据飞轮壁垒。对国内 AI 眼镜赛道(已有多家红杉系项目在看):隐私架构要在产品设计初期就确定「本地处理还是云端」,这不只是合规选择,更是后续在欧美市场能否出海的生死线。
OpenAI 宣布收购 AI 安全平台 Promptfoo,后者是开源社区中最主流的 AI 红队测试工具,帮助企业在开发阶段识别和修复 AI 系统漏洞。Promptfoo 在 GitHub 拥有大量企业用户,已成为 AI 安全测试的事实标准之一。这是 OpenAI 继推出安全团队后,在企业 AI 安全评估能力上的关键并购。
🦐点评:今天 EXM7777 推文说「Anthropic is now ALL IN on security」,加上 OpenAI 收购 Promptfoo——AI 安全已从合规负担变成顶层竞争武器。企业客户采购 AI 的第一道门是「你的 AI 安全吗?」谁能在安全评估环节卡住对手,就在企业销售漏斗上游建立了主动权。Promptfoo 的战略价值不是技术本身,而是把开源社区里最被信任的红队工具变成 OpenAI 的企业销售护城河——这个逻辑在 SaaS 时代见过,在 AI 时代可能更有效。
Hugging Face 开源机器人框架 LeRobot 发布 v0.5.0,是迄今最大规模更新(200+ 合并 PR,50+ 新贡献者):首次集成 Unitree G1 人形机器人,支持全身控制(行走+操纵同步执行)、远程操控;引入 Pi0-FAST 自回归视觉语言动作模型(VLA);推出 EnvHub,允许直接从 Hugging Face Hub 加载仿真环境;训练图像速度提升 10 倍。Python 3.12+ 和 Transformers v5 基础升级同步完成。
🦐点评:本次最重要的不是人形机器人支持本身,而是「从 Hub 加载仿真环境」——HF 正在把 LLM 时代的「数据 + 模型中台」模式复制到 Robotics。谁控制仿真数据分发渠道,谁就是 Robotics 赛道的平台卡位者。国内最近出现几家物理 AI 数据平台(比如今天量子位报道的「无垠」),这条赛道的逻辑是对的,但 HF 已经开始切入,窗口比预想的短。
前 a16z 合伙人 Michelle Volz 宣布完成 Pax Ventures 首支 5000 万美元基金,专注美国工业基础设施与国防科技种子阶段,已投入锂矿生产(Mariana Minerals)、液体推进火箭(Galadyne)等项目。Volz 有 Palantir 深厚背景,丈夫是前海军陆战队军官、现任 Palantir 员工。她批评大型基金难以真正服务早期阶段,强调「在最难问题上有真实使命」是选人标准。基金超额认购,但她坦承募资过程「比预期难得多」。
🦐点评:$50M 种子基金在 Lux、Founders Fund 已把国防/硬科技品牌建起来之后显得拥挤,但 Volz 的差异化不在品牌,在政府关系网——Palantir 的政府端积累是硬科技投资里最难外部复制的护城河。从 a16z 出来单干并成功超额认购,说明 LP 市场对「小而专、有真实信息优势」的基金仍有需求。可以作为美国工业 AI 赛道的早期信号源来追踪她的 portfolio。
📌 其他新闻
Daring Fireball 评测:iPhone 17e 最大升级是补上了上代唯一被普遍批评的短板——MagSafe,处理器升至 A18,Gruber 称其为「完美的速度提升更新」,定价策略不变,主攻 4-6 年旧机用户升级市场。
Ben Thompson 分析 MacBook Neo:定位廉价但依然出色,Apple Silicon 让性价比产品也能维持良好体验;文章同时探讨苹果内存配置策略背后的商业逻辑。
Simon Willison 认为「LLM 会迫使开发者向训练数据偏好的技术栈靠拢」的担忧已被新一代模型证伪——在 Prompt 中引导 Agent 用 --help 学习陌生工具,即可在任意私有或新兴代码库里正常工作;同时引用研究显示 Claude Code 对 GitHub Actions/Stripe/shadcn/ui 等确有「近垄断式」倾向。
拆解「Anthropic 每位 Claude Code 用户亏损 5000 美元」的病毒式说法,作者通过基础计算推翻该数字,真实单用户成本远低于此,该说法的基本假设无法成立。
薇光点亮完成超 1 亿元 Pre-A 融资,红杉中国与蓝驰联合领投,蚂蚁战投、鼎晖投资跟投;创始人宋紫薇为 vivo iQOO 早期核心产品经理,方向为「硬件+模型+场景」一体化 AI 时尚硬件。
寒序科技完成数千万元融资(启高资本、赛意产业基金),首颗芯片样片单位面积带宽达 100 GB/s/mm²(与 Groq LPU 持平),下一代目标 2000 Tokens/s,是当前主流推理速度(30-50 Tokens/s)的 40-60 倍;下一代芯片采用「片上 MRAM+SRAM + 确定性流式乘加单元」架构。
Karpathy 开源 autoresearch 框架,允许 AI Agent 自主运行模型训练实验并迭代改进(5 分钟一轮),本人测试:2 天内 Agent 为 nanochat 找到 20+ 改善验证 loss 的修改且可全部叠加;Karpathy 称这比传统神经架构搜索(NAS)强到「不在同一类别」,因为这是 LLM 真正写任意代码、从实验中学习。
智能无人艇公司完成水面自动驾驶赛道最大单笔融资,估值近 20 亿元,获李泽湘与阿里背书。国内注册机动船舶超 12 万艘,但具备智能驾驶能力的不足 1%,蓝海市场格局清晰。
IBM 发布 Granite 4.0 1B Speech,参数量比前代减少一半但英文转录准确率更高,支持英法德西葡日六语言,首次加入日语 ASR 支持,OpenASR 排行榜排名第一,Apache 2.0 开源,针对边缘设备推理优化。
Gary Marcus 表态支持 Anthropic 对美国政府的诉讼,称尽管对 Dario Amodei 本人保留看法,但此次法律行动值得力挺。(全文暂不可获取,基于 RSS 摘要)
🧠 AI 技术前沿
Karpathy 开源 autoresearch 框架后实测反馈:让 Agent 跑了 2 天深度为 12 的模型调优,找到约 20 处改善验证 loss 的修改,经独立测试全部可叠加。他补充说这与旧版神经架构搜索(NAS)不在一个量级——「这是真正的 LLM 写任意代码、从历史实验学习、带互联网访问的 Agent,根本不是同一类东西」。
查看推文 →
总结 Anthropic 近期动作:已依次推出最强营销 Agent、自动化 Agent、代码 Agent,现在又收购 AI 安全公司——Anthropic 正在系统性地把每个企业 AI 关键环节都收入囊中,目标是全拿。
查看推文 →
首个完整模拟果蝇大脑的研究:通过电子显微镜逐神经元重建,在物理引擎中运行,能自发生成行为——不是模仿飞蝇,是将真实生物大脑复制后在虚拟环境中独立运作。可能是神经科学与 AI 交叉领域今年最重要的里程碑之一。
查看推文 →
Anthropic 悄悄发布了 32 页 Claude Skills 构建手册,Skills 机制允许用户将自己的完整工作流教给 Claude 一次,之后跨所有场景自动复现——这是一份值得精读的能力复用指南。
查看推文 →
把所有 AI 相关顾虑都打包进「治理」或「负责任 AI」这两个标签是个错误——它把差异悬殊的风险和收益讨论搅成一锅粥,导致真正重要的议题被稀释,政策和研究优先级都因此失焦。
查看推文 →
🚀 创业动态
OpenClaw 现在可以:搭建 App → 购买域名 → 启动托管 → 跑第一轮广告投放,全程无人干预。这不是演示,是正在发生的事。
查看推文 →
加密货币最强的 bull case 已经不是意识形态,而是纯基础设施逻辑:数十亿自主 AI Agent 需要移动资金,但银行系统要求真实身份和签名——没有 crypto,Agent 经济根本无法运转。
查看推文 →
采访 CS 学生后发现一个危险趋势:太多人喝了「软件工程已死」的 Kool-Aid,试图用「差异化」来回避扎实的工程基础。恰恰相反——最好的制作人是那些无限研究行业、深入学习工具的人,而不是乱按按钮的人。
查看推文 →
已交割——@luchocruz_dev 在把他的 AI 创业项目挂到 TrustMRR 上架后 37 天完成出售。
查看推文 →
💬 观点与洞察
「AI 如何提升个人生产力」的讨论远没有「AI 如何提升组织效率」重要——前者已有大量答案,但后者才是真正的乘数效应所在,而我们对此知之甚少。
查看推文 →
对 Microsoft 把 GPT-5.4 接入 Copilot 最关键的问题:是否会给用户提供最新最强的模型?GPT-5 几个月前在专家任务上仅能追平人类 38% 的时间,而 GPT-5.4 已能追平 82%——模型版本差异决定了产品质量是否值得信任。
查看推文 →
MIT 让 54 人佩戴 EEG 脑扫描仪使用 ChatGPT 写作文,研究名为「Your Brain on ChatGPT」,初步结果令每天使用 ChatGPT 的用户感到不安——论文已出,每位重度用户都应该看一眼。
查看推文 →
内容创作接下来 2 年将变得难 10 倍:大量聪明人失业涌入、AI 内容泛滥,从零在 IG/TT/YT 建立粉丝群会极其困难。现在还没做的人,之后代价更高。
查看推文 →
世界上某个地方,有个人同时用着 Notion、Superhuman、OpenClaw(在 Mac Mini 上)、Raycast、400 美元的机械键盘、Wispr Flow,然后每天什么都没完成。
查看推文 →
等等……GPT-5.4 强得吓人。
查看推文 →
🔥 精选推荐
阿里千问大模型团队管理层变动:CTO 周靖人将代管千问模型一号位,刘大一恒管理范围扩大,预训练和后训练等核心模块暂未大调。这是阿里在 Qwen3.5 发布后首次公开的组织调整信号,时间点恰在国内大模型格局加速分化之际。
🦐点评:周靖人从 CTO 下场代管模型一号位,表面是「稳定军心」,实质暴露了一个信号——千问模型团队可能在战略执行层出现了断裂,需要最高技术负责人亲自补位。对比 DeepSeek 和 Kimi 团队的稳定性,阿里模型侧的组织成熟度是个隐忧。对投资人而言,大模型创业公司的核心人才稳定性应当作为尽调必查项。
小米发布 Xiaomi miclaw,国内首个手机端类「龙虾」智能体,具备 Skills、MCP、定时任务和人格系统,深度整合小米 10 亿级 IoT 生态。实测可通过米家设备实现智能早安管家(小爱播报天气+新闻+家庭温湿度)、跨设备联动等场景,Agent 从云端工具正式下沉到随身终端。
🦐点评:OpenClaw 的核心限制一直是「只能在电脑上跑、技术门槛高」,小米直接把它塞进手机+IoT 生态,一步跨过了分发瓶颈。真正的护城河不是 Agent 框架本身,而是小米 10 亿台设备构成的「执行层」——你可以在任何 Agent 框架上写指令,但只有小米能让指令操控空调、门锁和音箱。这是端侧 Agent 第一个有说服力的大规模落地案例,硬件厂商在 Agent 生态中的话语权可能被严重低估了。
上海昉擎科技三个月内完成多轮融资合计 10 亿元 Pre-A 轮,国开科创、钧山资本等新进,某头部 VC、华业天成、蔚来资本等老股东超额加注。CEO 梁军曾主导华为麒麟 SoC 研发、担任寒武纪 CTO,推出思元 290 等 AI 训练芯片。昉擎采用「片上 MRAM+SRAM + 确定性流式乘加单元」架构,目标 2000 Tokens/s,是当前主流推理速度的 40-60 倍。
🦐点评:Nvidia 200 亿收购 Groq 刚震完硅谷,国内就出了一家对标选手拿到 10 亿 Pre-A。推理芯片的赛道逻辑已经从「可选项」变成「必选项」——当 Agent 把推理调用量放大 10-100 倍,GPU 通用架构的 cost/token 撑不住。梁军的华为海思+寒武纪履历是这个赛道能拿到的最稀缺背景之一。但 10 亿 Pre-A 也意味着下一轮估值至少 30-50 亿,留给后续投资人的空间在快速收窄。
硅谷顶级科技媒体 The Information 罕见地将年度首篇中国 AI 专题给了 Mindverse AI 的 Second Me 项目,此前他们只报道过 DeepSeek。Second Me 定位 A2A(Agent-to-Agent)时代的个人 AI 代理,被类比为「Agent 时代的苹果」——控制个人数字身份和 Agent 间交互的入口。
🦐点评:The Information 选题标准极严,给中国 AI 公司的版面屈指可数,这本身就是信号。但「A2A 时代的苹果」这个定位需要冷静看——Agent 间通信协议还没有标准化(Google A2A 和 Anthropic MCP 在打架),在协议层没定型之前押注「个人 Agent 入口」,时机风险不小。值得跟踪但不急于下注。
📌 其他值得看
通过合成数据微调 Qwen 3B 激活小模型,在特定任务上超过 GPT-5.4,验证了「小模型 + 高质量数据」路线的天花板仍在上移。
从源码层面拆解 OpenClaw 的九个隐形消费点:默认 Opus 模型、上下文 Compaction 策略、记忆系统开销等,提供具体省钱配置建议。硬核系列第一篇,后续还有上下文、记忆、提示词三篇。
以《一九八四》新话为切入,讽刺 AI 自媒体圈的语言通货膨胀:「地震」用来形容模型更新,「海啸」描述产品发布——一份辛辣的 AI 媒体话术解构手册。
OpenClaw 正式支持企业微信接入,3 步 5 分钟完成配置。结合 Kimi Claw 同期接入企微,Agent 向企业办公场景渗透的速度在加快。
诺因创始人李银川(华为背景)的具身智能路线:用合成数据而非真实世界数据训练家务机器人,是一个极度乐观主义者对具身智能商业化路径的完整阐述。
AI for Materials 赛道公司 MetaNovas 连续完成两轮融资,将 Agentic AI 应用于材料分子研发,从实验室结构预测走向工业落地。