🔥 精选推荐

OpenAI 与 Dell 宣布合作,将 Codex 部署到混合云和本地基础设施环境。Codex 已成为 OpenAI 增长最快的企业产品之一,每周超过 400 万开发者使用。更关键的是 Codex 正在从编码工具扩展为通用企业 Agent——团队已开始用它汇集跨工具上下文、准备报告、路由产品反馈、鉴定线索。Dell 将把 Codex 接入其 AI 数据平台和 AI Factory,使企业能在自有基础设施上安全运行 AI 编码代理。
🦐点评:400 万周活开发者 + "expanding beyond coding" 是关键信号——OpenAI 正在把 Codex 从代码助手重新定位为企业级 Agent 平台。选择 Dell 而非纯云厂商做 on-prem 部署,暗示大型企业客户对数据主权的需求比想象中更刚性。这对纯云端 AI 编码工具(Cursor、Replit)构成结构性压力——当 OpenAI 自己做本地部署时,靠"模型能力"竞争的窗口在迅速关闭。
openai.com
乌克兰连续创业者 Yaroslav Azhnyuk 从做宠物摄像头(PetCube)转型创办 The Fourth Law,成为全球最先进的 AI 引导无人机公司之一。他与 Noah Smith 在两小时深度对谈中系统梳理了无人机战争的技术栈——FPV 无人机成为"新战神"、光纤 vs AI 自主、五级自主性框架、自主战场的八个维度。核心判断:现代战场已经把西方远远甩在后面,中国的制造业优势使得无人机竞赛的差距正在扩大而非缩小。
🦐点评:这不是一个科幻讨论——Azhnyuk 的公司在乌克兰战场上每天实战部署 AI 无人机。"五级自主性"框架把国防 AI 从模糊概念拆解成可投资的技术层级,而他对中国制造业壁垒的判断直接影响西方防务科技创业公司的竞争定位。对 VC 来说,防务科技赛道的关键不在模型能力,而在硬件供应链和量产能力——这个判断与当前硅谷国防 AI 热潮的主流叙事(软件吃掉一切)有根本分歧。
latent.space
Anthropic Claude Code 团队工程师 Thariq Shihipar 分享了一种新的 AI 协作范式:用 HTML 取代 Markdown 作为 AI Agent 的沟通和规划格式。核心理念是"99% 的 AI 生成 token 应该用于规划、接口和沟通,而非生产代码"。他展示了如何用 HTML 制作交互式规划文档、一次性微型 UI、以及跟随代码库移动的"活设计系统"。他把工程师的新角色定义为"compute allocator"——不再亲手写代码,而是分配计算资源。
🦐点评:Anthropic 内部工程师亲自示范"compute allocator"工作方式,这可能是对未来软件工程师角色最清晰的重新定义。99% 的 token 用于沟通而非写码——如果这个比例成立,意味着 AI 编码工具的核心价值不在"生成代码速度"而在"理解和呈现意图",这直接改变了 developer tools 赛道的估值逻辑。Cursor、Windsurf 等工具如果继续强调代码生成能力而忽视规划和沟通层,可能在错误的维度上竞争。
lennysnewsletter.com
IBM Research 与 Hugging Face 联合发布开放 Agent 排行榜,首次系统性评估通用 AI Agent 的能力。关键洞察:评估 Agent 不能只看底层模型得分——Agent 是一个完整系统,包括工具选择、规划步骤、记忆管理、错误恢复,改变任何一个组件都会影响最终表现。排行榜提供了可复现的评估框架和公开数据,让社区可以比较不同 Agent 架构的实际表现。
🦐点评:Agent 赛道最缺的不是模型能力,而是评估标准——没有标准就无法比较,无法比较就无法做投资判断。这个排行榜把"Agent 好不好用"从主观感受变成可量化指标,其意义类似于 LMSYS Chatbot Arena 对 LLM 的定价锚定作用。对投资人的实操启示:被投公司声称"我们的 Agent 最强"时,终于有了一个独立的第三方验证入口。
huggingface.co

📌 其他新闻

九人陪审团一致裁定马斯克在三年诉讼时效到期后才提起诉讼——他早在 2021 年就知晓相关行为,却直到 2024 年夏才起诉。这一裁决扫除了悬在 OpenAI(估值 7300 亿美元)头上的最大法律风险。
nytimes.com
Ben Thompson 分析数据中心遭遇的公众反对——电价上涨、噪音、土地占用等问题有合理性,唯一有效的解决方案是直接补偿受影响社区。对 AI 基础设施建设的政策讨论有重要参考价值。
stratechery.com
NVIDIA 发布 Cosmos Predict 2.5 的 LoRA/DoRA 微调指南,专门面向机器人视频生成场景。这是"世界模型"从概念走向可微调工具的重要一步,标志着具身智能的视觉预训练基础设施正在成熟。
huggingface.co
字节旗下番茄小说正在推动 AI 动漫上院线,开放头部 IP 改编权限。此前粗制滥造的 AI 漫剧改编消耗了 IP 价值,字节希望通过院线级内容重塑番茄出品的品质形象。这是 AI 内容生成从"短视频填充"走向"影院级"的首个明确信号。
36kr
高榕创投、昆仑资本联合领投,紫金矿业等产业方参投,老股东高瓴创投等多轮追投。公司聚焦大运力、低成本、快速复用液体火箭,今年计划交付三枚火箭。过去一年连续完成 4 轮融资,资本密集押注可复用火箭赛道。
36kr
arXiv 出台最严新规打击 AI 生成论文,违规者将被封禁一年且所有署名作者连坐。陶哲轩公开表态支持。"生成论文远比消化容易"——学术界开始系统性应对 AI 对论文质量的冲击。
量子位
华为正在经历一次罕见的人才外溢,大量前华为员工涌入具身智能创业赛道。从硬件到软件、从算法到供应链,华为体系培养的人才正在撑起中国具身智能创业的半壁江山。
量子位

🧠 AI 技术前沿

cursor_ai @cursor_ai
Cursor 发布 Composer 2.5,基于 Moonshot Kimi K2.5 开源底座训练,号称同等能力下效率提升 10 倍。同时宣布与 SpaceXAI 合作,将在 Colossus 2(百万 H100 等效算力)上从零训练更大模型,算力投入提升 10 倍。
查看推文 →
AnthropicAI @AnthropicAI
Anthropic 宣布收购 Stainless API——一个 SDK 和 MCP 服务器平台,从最早期就为 Anthropic 的所有 SDK 提供支持。这次收购意味着 Anthropic 将 SDK 基础设施内部化。
查看推文 →
karminski3 @karminski3
字节跳动发布开源多模态模型 Lance,激活参数仅 3B,却能同时接受文本/图片/视频输入并输出文本/图片/视频。视觉输入用 Qwen2.5-VL-ViT,输出用 Wan2.2_VAE,训练成本仅 128 张 A100。核心亮点是"拼得好"——用成熟组件高效组合出全能模型。
查看推文 →
karminski3 @karminski3
Qwen3.7-Max-Preview 在 ArenAI 内测跑分出炉,整体排名第 13,数学能力第 7,编程第 10,视觉第 16,目前为国产模型 SOTA。空间理解和指令遵循相比 Qwen3.6-Plus 有明显提升。
查看推文 →
emollick @emollick
Claude 和 GPT 的一个常见问题:模型会在输出中暴露无关的对话历史——幻灯片会出现"更好、更有针对性的版本"之类的页脚,文档会引用"改进后的版本"。这是 theory-of-mind 的系统性失败。
查看推文 →
egeberkina @egeberkina
展示了基于 LTX-2.3 的 Video-to-Video 工作流:可以保留原始视频的姿态、深度或边缘信息,同时用新的提示词和起始图完全重建场景。可能是目前最实用的视频风格迁移方案。
查看推文 →

🚀 创业动态

vasuman @vasuman
语音是企业中最被忽视的商业触点——客户已经拨了电话、愿意等十分钟、无法切换标签页比价——这是注意力最集中的渠道,但一直因为人力成本(每人每班约 40 通电话)而无法规模化。语音 AI 改变了这个经济模型。
查看推文 →
vasuman @vasuman
Varick 客户的 AI 采购行为正在发生变化:几个月前企业愿意无限烧 OpenAI/Anthropic token,现在开始要求审计 AI 支出、为不同任务匹配合适的模型。企业想确认 AI 确实比增加人力更便宜。
查看推文 →
EXM7777 @EXM7777
文本 Agent 正在被商品化,目前最被低估的 AI 机会是语音电话。每个人都在做聊天机器人因为简单——文本进、文本出。但语音面对实时延迟、口音、背景噪音等挑战,400ms 延迟就会让通话体验崩溃。大多数团队做不了,这正是壁垒所在。
查看推文 →
shao__meng @shao__meng
揭秘 Lovart 的兴衰:从在 X 上铺天盖地投商单推广,到做 Nano Banana 中转代理,再到因国内大规模 PR 导致代理被发现、流量被切断。这是一个 AI 产品在跨境分发中踩坑的典型案例。
查看推文 →
marclou @marclou
一个 MRR $700 的读书会项目在 trust_mrr 平台上以 $12,000 成交,仅用 38 天完成交易。小型 SaaS/社区项目的二级市场正在活跃。
查看推文 →

💬 观点与洞察

shao__meng @shao__meng
警示:不要把学习外包给 AI。三项研究趋同发现——Anthropic 实验中 AI 组理解测验 50% vs 对照组 67%;MIT 研究显示 LLM 用户脑区耦合最弱;83% 的人写完文章后无法引用自己刚写的内容。"认知投降"的积累效应正在侵蚀工程师的独立判断力。
查看推文 →
shao__meng @shao__meng
TRAE 团队公布用户实际使用的 Agent Skills Top 10,覆盖从 UI 设计到调试的全链路。流程治理类(brainstorming、writing-plans、using-superpowers)强制在写代码前完成结构化设计;行为护栏类(karpathy-guidelines)约束过度假设和过度工程。
查看推文 →
godofprompt @godofprompt
"一人公司"时代只持续了五分钟。现在正进入"零人公司"时代:AI Agent 运行增长、内容、销售和运营,创始人每周只需投入 4 小时。对仍在为每个任务招人的公司是严酷的冲击。
查看推文 →
emollick @emollick
AI 检测是一个雷区——如果你大量使用 AI,你一眼就能认出 AI 写作,但客观证明 AI 使用却极其困难。这种"直觉确信"与"无法证明"之间的落差令人沮丧。
查看推文 →

🔥 精选推荐

豆包是中国唯一 DAU 过亿的 AI 产品,但正在刻意降低对用户规模的关注。春节期间冲刺 2 亿 DAU 的目标暴露了 AI 产品的反规模效应——用的人越多,推理成本越高,收入不会同步增长。五一开启付费订阅后用户质疑"笨还收费",团队紧急修复。豆包延续了字节在抖音、TikTok 上的方法论(拟人化、离用户近、极速迭代),但 AI 时代的边界正在显现:当用户从聊天娱乐转向追求"聪明",DAU 必然受影响。文章还原了豆包从秘密项目到亿级产品的完整路径,包括产品负责人朱骏的设计哲学和团队对声音、交互的极致打磨。
🦐点评:豆包的困境可能是所有 AI 超级应用的预演——DAU 破亿但推理成本随用户线性增长,这和传统互联网的边际成本递减是根本性矛盾。据 AppGrowing 数据,豆包两年只花了 17 亿投流(阿里千问 37 亿),说明字节的分发效率仍然惊人。但"笨还收费"的用户反馈指向一个更深层问题:当 AI 助手从免费获客转向付费变现,用户的质量预期会指数级跳升。对投资人来说,中国 AI to-C 赛道的真正考验不是谁先到 1 亿 DAU,而是谁能在付费转化中留住用户。
晚点LatePost
云知声创始人黄伟提出"AI 公司行业价值 = 智能密度 × Token 价值"的公式。智能密度指用较小参数和更低成本达到足够高的智能水平——云知声的 U2 模型用 2600 亿参数达到 1.2 万亿参数模型的性能,参数效率近 5 倍。Token 价值则区别于黄仁勋讲的 token efficiency(生产效率),强调 token 能转化为多少商业收入。这家 2012 年成立的"AI 元老"在 2025 年完成港股上市,不到 500 人团队实现年营收超 10 亿,大模型收入 6.1 亿同比增长超 10 倍。黄伟判断"2023-2025 年是热身赛,2026 年正赛才开始"。
🦐点评:黄伟的公式把 AI 公司估值逻辑从"参数规模竞赛"拉回到"单位 token 商业价值",这对当前动辄千亿参数、烧钱百亿美元的赛道是一记清醒剂。云知声 500 人团队 10 亿营收、人均产值 252 万的数据,在中国 AI 公司中确实罕见。"不需要院士来开滴滴"的比喻精准指出了 AI 落地的核心矛盾——绝大多数任务场景不需要最强模型,但投资人和创业者仍在追逐参数规模。
晚点LatePost

📌 其他值得看

作者用 Claude Code 连接飞书处理合同、邮件、材料、活动复盘,一小时过几十份文档,工作总量翻十倍。从"试一次"到"回不去了"的真实使用路径,展示了 Agent + 飞书 + CLI 组合在日常办公中的实际效果。
赛博禅心
国内医院 AI 普遍采取"科室各自采购"模式,导致数据孤岛、算力浪费、模型无法复用。行业正在从单点模型向统一 AI 底座转型,寻求"用得好、用透、用得久"的解法。
晚点LatePost
豆包与国内 20 多家博物馆深度合作上线讲解功能。打开语音和摄像头即可获得实时文物讲解,支持轻声交流、听众身份定制(儿童/专业人士)、与路线无关的自由讲解。在多模态 AI 消费场景中,这是一个具体且可感知的落地案例。
歸藏的AI工具箱
Lemonade CEO Daniel Schreiber 反驳 Andreessen、黄仁勋等人用工业革命为 AI 乐观主义辩护的论述。核心观点:工业革命确实"最终"结果很好,但那个"最终"藏着几十年的工资停滞、童工、社会动荡——改善不是自发的,是制度性干预的结果。
深思SenseAI
OpenAI 收购 AI 语音克隆公司 Weights.GG,6 名核心成员入职。OpenAI 在语音技术上持续补强,从 Whisper 到 Voice Mode 再到收购语音克隆团队,语音赛道布局日益完整。
Z Potentials
翻译 Jacob Harris 的文章,从守财奴心态、信任缺失、乐趣丧失等角度解释为什么选择不用 AI 辅助编程。作为反面视角,有助于理解 AI 编码工具渗透率天花板的潜在因素。
宝玉AI
洛杉矶 AI lifestyle 产品 Viba 从消费意图形成之前切入——用 AI 生成以用户本人为主角的穿搭灵感,再接入真实商品。MVP 测试单日自然浏览量突破 10 万次,次周留存 53%。创始人梁芊荟来自 MIT 计算审美实验室和华为影像团队。
有新Newin