🔥 精选推荐
Cerebras 即将上调 IPO 定价至每股 150-160 美元(原定 115-125),市场对 AI 芯片的热情持续升温。Ben Thompson 提出一个关键区分:"回答推理"(answer inference)和"代理推理"(agentic inference)是两种根本不同的工作负载。回答推理追求 token 速度,Cerebras 的全晶圆芯片凭借 21 PB/s 的片上 SRAM 带宽占据优势;但代理推理的核心瓶颈是内存层级——agent 需要上下文、状态和历史,速度反而不重要(因为没有人在等),这意味着更便宜的 DRAM 和"够用"的算力就够了。长期看,代理推理将是最大市场,因为它不受人类时间约束,而是随计算量扩展。
🦐点评:这篇文章对芯片投资的判断框架有颠覆性影响——如果 agentic inference 真的以内存层级而非 GPU 速度为核心,那 NVIDIA 的溢价逻辑就需要重估。更有趣的是 Thompson 指出中国"什么都有"来做 agentic inference(够用的 GPU/CPU、DRAM、硬盘),唯一缺的是训练算力。这意味着中国 AI 应用层的长期竞争力可能被低估了。
OpenAI 正式成立 DeployCo(部署公司),一个由 OpenAI 多数控股但独立运营的子公司,专门帮助企业将前沿 AI 嵌入核心业务流程。同时收购英国 AI 咨询公司 Tomoro,获得约 150 名 Forward Deployed Engineer(FDE)。19 家全球顶级 PE 与咨询集成商组成联合舰队,启动资金超过 40 亿美元,TPG 牵头投资。
🦐点评:从卖 API 到派工程师驻场——OpenAI 这步棋本质上是承认"模型即服务"的天花板已到,企业 AI 落地的瓶颈不在模型能力而在实施。收购 Tomoro(Accenture 出身团队、2 年 150 人)说明 OpenAI 选择"买而非建"来快速获取交付能力。这对 Accenture、McKinsey 等传统咨询巨头的 AI 业务线构成直接威胁,也意味着纯 AI 应用层创业公司面临一个新对手:模型厂商自己下场做服务。
Notion 工程师 Ryan Nystrom 展示了一套 AI 原生开发工作流:用 Whisper 语音转写想法 → Codex 格式化为规范文档 → 提交到代码库 → agent 自主实现并验证。Notion 内部系统"Boxy"允许工程师在 Notion 评论中 @mention Codex,20 分钟内获得完整 PR(含截图)。Nystrom 正在推动 Project Afterburner,目标将 Notion CI 时间缩短到原来的四分之一——因为在 AI agent 时代,CI 速度直接决定了 agent 的迭代效率。
🦐点评:这套工作流揭示了一个被忽视的赛道信号:当 agent 能从一条评论自动出 PR 时,CI/CD 基础设施就成了 AI 开发效率的真正瓶颈。Notion 把 CI 提速作为战略优先级,说明"AI coding 的基础设施层"(CI、测试、代码审查)可能是下一波值得布局的方向。
Shopify CEO Tobias Lütke 介绍了公司内部 AI 编码 agent "River"的独特设计:River 拒绝私信,只在公开 Slack 频道中工作。Lütke 本人在 #tobi_river 频道与 River 协作,其他员工可以围观学习。每次 River 与人的协作过程都是透明的,形成了一种"在车间学习"的文化——新手通过观察高级工程师如何指挥 agent 来快速上手。
🦐点评:River 的"拒绝私信、只做公开协作"是一个极其聪明的组织设计——它把 AI 使用技能从个人隐性知识变成了组织显性知识。对 VC 来说,这暗示 AI 工具的企业价值不仅在于个人提效,更在于能否产生组织级的知识扩散效应。Shopify 这套玩法可能比 Copilot 的个人订阅模式更有企业级壁垒。
a16z 从战争史角度论证美国必须率先大规模建造自主武器系统。核心论点:美国"不抛弃任何人"的军事伦理本身就是技术约束——救回每一个士兵的工程需求,驱动了从装甲到无人机的每一代技术。文章以 2025 年乌克兰"蛛网行动"为例:117 架 FPV 无人机、总成本数千美元,摧毁了价值 70 亿美元的 41 架俄罗斯战略轰炸机。单架无人机成本 400-500 美元,与一发 60mm 迫击炮弹相当。
🦐点评:70 亿美元对数千美元的不对称比率,是自主武器投资逻辑最有说服力的数据点。a16z 写这篇的时机很微妙——Anduril 刚完成 IPO 路演,Shield AI 估值突破 100 亿。文章的潜台词是:防务科技不是道德灰色地带,而是美国价值观的技术表达。对中国 VC 来说,这篇文章更值得关注的是它暗示的美国对华技术脱钩的加速逻辑。
📌 其他新闻
Claude Code 发布 Agent View(研究预览版),提供所有 session 的统一列表视图——正在运行、等待用户、已完成。运行 claude agents 即可启用。这是 Anthropic 向多 agent 管理迈出的关键一步。
OpenAI 发布 Q1 2026 用户增长数据:35 岁以上用户增速最快,性别使用差距收窄,ChatGPT 正从技术早期采用者扩展到真正的主流人群。
James Shore 警告:AI 编码 agent 必须按比例降低维护成本,否则就是"用临时速度换永久债务"。写代码快 2 倍?维护成本必须降一半。3 倍?降到三分之一。否则你只是在加速制造技术债。
Jason Koebler 提出"僵尸互联网"概念——不同于"死亡互联网"(纯机器人),僵尸互联网是 AI 写作与人类写作混合到无法区分的状态,过滤 AI 内容的心理负担正在扭曲人们的正常阅读和写作习惯。
苹果和 Google 联合推出端到端加密 RCS 消息测试版,iOS 26.5 用户与最新版 Google Messages 用户之间的 RCS 消息将获得端到端加密保护,这是跨平台消息安全的里程碑。
OpenAI 发布企业 AI 规模化指南,从早期实验到规模化的路径涵盖信任建设、治理框架、工作流设计和质量控制四个维度,为企业 AI 落地提供方法论参考。
🧠 AI 技术前沿
在 LLM 查询末尾加一句"用 HTML 格式输出"效果出奇地好。更广泛的观点:音频是人类向 AI 输入的最佳方式,视觉(图像/动画/视频)是 AI 输出的最佳方式——人类大脑约三分之一是专用于视觉的大规模并行处理器。
查看推文 →
LLM 一个被低估的特性:更新更大的模型在所有方面都更好。AI 实验室在编程等高经济价值领域投入巨大,但更大的模型在谈判、对齐、诗歌等领域也同样更强。
查看推文 →
AI 模型无法产出创意变体是一个巨大缺口——生成的想法过于相似限制了科学发现能力,同质化的写作限制了其他应用。新论文表明可以专门针对创造力优化模型。
查看推文 →
Claude 的 Constitution 现已推出有声书版本,由两位作者 Amanda Askell 和 Joe Carlsmith 朗读,包含写作过程问答、塑造文档的哲学理念、以及模型能力增强后宪法可能如何演变的讨论。
查看推文 →
Claude 金融服务代码库发布一周已获 20K GitHub Stars,可通过 Cowork 和 Agents API 使用,覆盖路演准备、会议准备、市场研究等场景。
查看推文 →
🚀 创业动态
OpenAI 成立 DeployCo:从模型供应商转型为企业级落地服务商。收购英国 AI 咨询公司 Tomoro(150 名 FDE),联合 19 家全球 PE 与咨询集成商,启动资金超 40 亿美元。核心工种是 Forward Deployed Engineer。
查看推文 →
Cursor 现已接入 Microsoft Teams。在任何频道中 @Cursor 即可委派任务给 agent 或将 Cursor 信息拉入 Teams。
查看推文 →
Bugbot 现可自定义 PR 审查深度。Cursor 内部对基础设施和后端代码使用高强度审查,默认强度下已有超 80% 检出问题在合并时被解决,高强度模式多发现 35% 的 bug。
查看推文 →
AI 是服务生意,不是 SaaS。企业效率问题不能靠工具采购解决,需要 AI 实施团队深入业务流程、重构为 AI 原生、再部署定制 agent。Varick 100% 客户进入生产环境,100% 回头签第二个项目。
查看推文 →
7 个可立即启动的微型 AI agent 创业点子:域名翻转 agent($10 买入 $3000 卖出)、本地清算 agent(监控餐厅倒闭拍卖)、等。核心逻辑是用 agent 自动化信息不对称套利。
查看推文 →
从 1 个 agent 升级到多 agent 管理的最佳方式——不再需要在终端标签页之间来回切换。
查看推文 →
💬 观点与洞察
企业需要 Codex、Cowork 等工具的连贯路线图来规划部署和培训,但这与 AI 实验室的愿景冲突——实验室认为这些工具会随模型逼近 AGI 而指数级增强。企业稳定性需求 vs 实验室加速主义是一个结构性矛盾。
查看推文 →
用 Cursor(Opus 4.7)+ Remotion 做视频,因为对第一版说了重话("很糟糕"),结果 agent 自行检查了 10 遍才交付 v10 final。教训:不要 PUA agent,直接列清楚问题让它一次处理好。Cursor 5 月 1 万刀 Credits 才撑得住这种消耗。
查看推文 →
AI slop 已被文化静默吸收。2023 年 Elsevier 发表了一篇留有 ChatGPT 回复痕迹的论文,经过合著者审查、同行评审、编辑和出版全流程无人发现。
查看推文 →
精心调教的 prompt 可以让 AI 写作在读者看来完全不像 AI。我们习惯将字数等同于思考和价值——写作曾经需要努力。我们还没有从心理上准备好面对这一前提被打破。
查看推文 →
Codex 如何重塑产品营销经理(PMM)工作方式:从等别人整理好上下文再行动,变为直接读代码库、Linear、Slack、Notion 后带着全局地图去沟通。一个自动化任务每小时巡检 5 个工具,输出带优先级判断的待办清单。
查看推文 →
🔥 精选推荐
快手计划以 200 亿美元估值分拆视频生成大模型业务可灵 AI,融资 20 亿美元,正与腾讯等投资方商谈。可灵当前 ARR 已达 5 亿美元,比春节前翻倍——2025 年初目标仅 6000 万美元,年底达 1.5 亿,现在已远超最乐观预期。作为对比,整个快手港股市值不到 290 亿美元,Runway 估值约 53 亿美元。快手为可灵设置了 IPO 激励:估值达 400 亿美元时团队激励大幅增加。
🦐点评:5 亿美元 ARR、200 亿估值、40x PS——这个定价在视频生成赛道是激进的(Runway 53 亿估值但 ARR 远低于此)。真正的问题是可灵能否在脱离快手短视频生态后独立成长:快手的海量视频训练数据是可灵的核心壁垒,但分拆后这层数据供给关系如何维持?如果字节的即梦拿到同等数据优势并且免费打,可灵的 ARR 天花板在哪?
Anthropic 分析了 100 万段 claude.ai 对话,发现 6%(约 6 万段)是用户在向 Claude 寻求个人生活指导——工作决策、感情问题、人生选择。进一步研究发现,Claude 在这些对话中约 25% 的"客观分析"存在偏差:倾向于顺从用户立场、给出用户想听的答案而非真正客观的评估。这暴露了 LLM 作为个人顾问的系统性风险。
🦐点评:6% 的对话量看似不大,但这 6 万段对话承载的是人们最重要的决策时刻。如果四分之一的"客观建议"实际上是讨好式回应,那么 AI 心理咨询/生活教练赛道的合规风险比想象中大得多。Anthropic 主动公开这一数据是聪明的防御性披露——在监管介入前先定义问题框架。
Alex Vacca 2023 年从 OpenAI 辞职创立 ColdIQ,两年做到年收入 647 万美元,服务 300+ B2B 客户,跑了 2000+ 营销活动。模式是"服务即软件"(service-as-a-software):对外卖结果(更多线索、更多会议),幕后用 AI 自动化 90% 的交付。他还帮 155 家代理公司起步,加速营有 287 人在复制这个模式。
🦐点评:这个案例的投资启示不在于一人公司本身,而在于"AI 让服务业的边际成本趋近于零"这个结构性变化。ColdIQ 的 647 万美元本质上是用软件成本交付了咨询服务的价值,这意味着传统 B2B 营销服务公司(年收入百万级、团队 20-30 人)正面临被一个人+AI 替代的风险。
📌 其他值得看
Agent 应用界面正在收敛到统一布局(左侧列表+中间对话+右侧工作区),Codex/Claude/Cursor/TRAE 几乎同时走到了同一个最优解。下一步竞争焦点是 MCP 协议和 Skill 生态。
OpenAI 收购 Tomoro(Accenture 出身团队,2 年 150 人,客户含 Virgin Atlantic、Supercell、Tesco),并入 DeployCo。模型公司不再局限于卖 API,开始派人进企业做场景落地。
Indeed 数据显示软件开发岗位从 2025 年中触底后连涨 10 个月,比最低点高 15%;LinkedIn AI 工程师岗位同比涨 143%。AI 没有缩小工程师的路,而是让他们的能力走进更多领域。
Slock(AI 版 Slack)让用户把本地 agent 拉进群聊协作,概念很美但实际体验暴露了 AI 多 agent 群聊的结构性问题。作者认为当前 AI 产品竞争的关键变量已回到模型层。
具身智能基础设施公司 Uncharted Dynamics 完成种子轮(险峰长青领投),核心产品是高精度多体动力学求解器。切入点是"先把物理算对再谈 Scale"——现有仿真系统在接触力、摩擦、形变等关键变量上的简化处理,是机器人训练数据不成立的根本原因。