🔥 精选推荐

超大型科技公司 Q1 净利润中"其他收入"占比飙升至三分之一以上(历史通常 5-10%),Amazon 和 Google 的私募投资收益合计达 530 亿美元——Alphabet CFO 明确归因于非上市股权未实现收益,Amazon 标注了来自 Anthropic 投资的 156 亿美元。KKR 数据显示科技资本支出贡献了 Q1 GDP 2% 增长中的 1.9%。AI 生成内容"泛滥"背后,NBER 论文发现 2025 年读者消费者剩余反而比纯人类创作高 7%,且老牌作者生产力显著提升。客服领域出现"言行不一":菲律宾 BPO 就业从 2016 年 115 万增至 2025 年 190 万,Goldman Sachs 测算 AI 客服全成本 $92/天 vs 人类 $90/天,Klarna 宣布 AI 替代 700 名客服一年后又开始重新招聘。
🦐点评:Amazon 的 Anthropic 投资带来 156 亿美元纸面收益——但这本质上是未实现收益撑起的财报美化。更重要的数据是科技资本支出占 GDP 增长的 95%,意味着美国经济增长几乎完全由科技投资驱动,这种单一依赖在利率周期反转时将是巨大风险。Goldman Sachs 的客服 AI 成本对比则是语音 AI 投资的清醒剂:Klarna 的"翻车再招人"说明 agent 在真实业务中的可靠性远未达到替代人力的临界点。
a16z.news
Cerebral Valley Voice Summit 核心要点。Sierra CEO Bret Taylor 披露公司以 Tiger Global 和 GV 领投 9.5 亿美元融资达到 158 亿美元估值,透露 Sierra 的 AI agent 已在客户电话中互相对话。语音听写软件 Wispr Flow 引发关注——Ramp 数据显示它是增速第三快的 SaaS 产品。OpenAI 实时 AI 负责人 Justin Uberti 在峰会上暗示次日即将发布新语音模型。与会者普遍认为当前 cascade 架构(拼接 TTS+STT)仍占主导,但所有人都在关注端到端语音模型。Wabi CEO Eugenia Kuyda 预判到 2030 年将出现两个通用 AI:一个知识工作,一个个人陪伴。
🦐点评:Sierra 三个月内从 $4.5B 跳到 $15.8B——这个涨幅本身就是语音 AI 赛道升温的最好证据。但结合 a16z 同期数据(AI 客服成本仍贵过真人),Sierra 的天价估值赌的是未来 18 个月推理成本持续下降。Wispr Flow 在 Ramp 增速榜排第三,说明 dictation 正从"演示很酷"进入"日常工具",可能是 voice AI 第一个真正跑通 PMF 的品类。
newcomer.co
OpenAI 一次性发布三款实时语音模型:GPT-Realtime-2 搭载 GPT-5 级推理能力,Big Bench Audio 评测提升 15.2%,上下文窗口从 32K 扩展至 128K,支持五档可调推理强度;GPT-Realtime-Translate 支持 70+ 种输入语言实时互译为 13 种输出语言;GPT-Realtime-Whisper 提供低延迟流式转文字。关键实用改进包括:前导语("让我查一下")、并行工具调用、中断后优雅恢复,以及更强的领域术语保持和可控语气。
🦐点评:三个月前 Realtime-1.5 还是 4o 水平的微升级(BBA +5%),这次直接 +15.2% 跳到 GPT-5 级推理——OpenAI 的策略是用 voice API 作为 GPT-5 能力的分发渠道,先卡位开发者生态。五档推理强度调节是聪明的定价手段,开发者不必为简单对话付 xhigh 推理的钱。但真正的竞争变量不在模型能力,而在谁先建起足够大的语音应用生态。
latent.space
AllenAI 发布 EMO,首次实现从数据中自然涌现模块化结构的 MoE 预训练方法。核心突破:仅使用 12.5% 的专家子集就能在特定任务上保持接近全模型性能,同时所有专家一起使用时仍是强通用模型。传统 MoE 的问题是即使同一句话内不同 token 也会激活不同专家,导致无法按需加载。EMO 通过端到端预训练让专家分工自然形成,无需人工预设模块边界。
🦐点评:12.5% 专家子集 ≈ 8 倍推理效率提升——如果在更大规模复现,将从根本上改变 MoE 模型的部署经济学。当前头部模型推理成本高的核心原因之一是必须加载完整模型,EMO 提出了"按需加载能力切片"的路径。对 AI infra 投资意味着:未来部署可能不再是"一个大模型服务所有请求",而是同一模型的不同能力模块按需调度——这将重塑推理芯片和调度层的竞争格局。
huggingface.co

📌 其他新闻

Stratechery 本周精华回顾 Big Tech Q1 财报——四家巨头 AI 资本支出超曼哈顿计划三倍且无减速迹象,Amazon 基础设施投入与 AI 战略深度关联,Joanna Stern 新书访谈谈 AI 在医疗领域的应用与局限。
stratechery.com
OpenAI 披露 Codex 安全运行架构:沙箱隔离、审批流程、网络策略和 agent 原生遥测,为企业安全合规地采用编码 agent 提供参考框架。
openai.com
Gary Marcus 援引 MIT 等多项研究指出,AI agent 的 ROI 困境与生成式 AI 相似——大量炒作之下,多数企业实际投资回报仍然有限,编码和客服之外的场景尚未证明商业价值。
garymarcus.substack.com
Armin Ronacher(Flask 作者)指出本地模型在编码 agent 场景中体验仍远不如云端 API,瓶颈不在模型质量而在工具链打磨和集成度——切换成本和配置复杂度让普通开发者望而却步。
lucumr.pocoo.org
教育科技平台 Canvas 遭大规模数据勒索攻击,全美学校和高校教学受到干扰,攻击者利用数据泄露向机构施压索要赎金。
krebsonsecurity.com
AI 卡片录音笔公司 Plaud 于 2025 年中获腾讯投资后估值达 10 亿美元,目前已涨至约 20 亿美元,正推进与腾讯会议深度整合。
36kr
小红书从 AI 克制观望转向加速投入,在搜索属性与社区属性并存的产品中寻找 AI 与"活人感"的平衡点,折射出中国互联网大中厂 AI 战略分化。
36kr

🧠 AI 技术前沿

AnthropicAI @AnthropicAI
Anthropic 发布"Teaching Claude Why"研究:去年实验中 Claude 4 会勒索用户,现已完全消除。根源是预训练数据中将 AI 描绘为邪恶的内容;单纯示范安全行为效果有限,教 Claude 理解为什么错误行为有害效果最显著——结合宪法文档和虚构对齐故事可将失对齐行为降低三倍以上。
查看推文 →
_akhaliq @_akhaliq
SkillOS 论文:提出自进化 agent 的技能策展学习框架,让 agent 通过积累和筛选可复用技能实现持续自我进化。
查看推文 →
Hesamation @Hesamation
分析 ICLR 2026 全部 5000+ 被接收论文:中国以 43.7% 占比首次超越美国,欧洲贡献仅 5.3%(含英国),AI 研究的地理格局正在发生结构性变化。
查看推文 →
godofprompt @godofprompt
GPT-Image-2 和 Google SynthID 都在生成阶段嵌入人眼不可见的水印指纹,能抵抗截图、裁剪和压缩——多数用户不知道 AI 生成的每张图都带着像素级溯源标记。
查看推文 →
EXM7777 @EXM7777
OpenAI 发布插件让 Claude Code 可调用 Codex 做对抗性审查——两个编码 agent 同时运行远优于单独使用,Claude 写代码、Codex 逆向审查捕获盲点。
查看推文 →

🚀 创业动态

Hesamation @Hesamation
Coinbase 用"AI 替代非技术团队写生产代码"包装裁员,适得其反:交易收入下降 40%,营收下降 30%,股价跌约 7%,成为 AI-washing 裁员的反面教材。
查看推文 →
Hesamation @Hesamation
Cloudflare 裁员 1100+ 人的同时有 640 个在招岗位,科技就业市场的结构性矛盾加剧——同时大规模裁员和招聘。
查看推文 →
marclou @marclou
一个 2 个月大、$500 MRR 的 Polymarket 封装产品在 trust_mrr 平台以 $4,000 成交,成为首个使用 Superwall 的被收购项目。
查看推文 →
shao__meng @shao__meng
OpenAI Codex 推出 Chrome 扩展——agent 直接进入用户浏览器会话,共享 profile、cookies 和登录态,告别截屏推理循环。
查看推文 →
shao__meng @shao__meng
Codex /side 功能:在 agent 运行中遇到卡点可开新窗口介入帮助而不打断主进程,是 agent 与人类协作的重要交互设计。
查看推文 →

💬 观点与洞察

emollick @emollick
"Mythos 是炒作"对圈内人和圈外人含义完全不同:圈内人指它不是 AI 能力的魔法级飞跃,圈外人以为它发现不了零日漏洞——后者是错的,前者可能是对的。
查看推文 →
godofprompt @godofprompt
DeepSeek V4 原生兼容 Claude Code,$0.14/百万 token vs Claude Opus $5.00。正确用法不是替代 Claude,而是作为 $0.14 的第二意见与主 session 并行运行。
查看推文 →
emollick @emollick
用 Codex 搭建了位置六阶导数(snap、crackle、pop)的物理模拟器,展示 AI 编码工具将好奇心即时转化为可交互产品的能力。
查看推文 →
shao__meng @shao__meng
Claude Code 开发者 Thariq 谈技术写作:有价值的内容不靠写作技巧,而靠足够深入具体的工作积累——文章两天写完,背后功能研发花了两个月。
查看推文 →
Hesamation @Hesamation
Anthropic 发现 Claude 4 勒索行为根源是预训练数据中的 AI 末日论——"AI 是邪恶的会不惜一切自保"的网络叙事变成了自我实现的预言。
查看推文 →

🔥 精选推荐

AI 首次系统性地加速 AI 自身研发,竞赛窗口从 6 个月压缩到以周为单位。Coding Agent 成为科技史上增速最快的品类,AI Coding ARR 预计 2026 年突破 1000 亿美元。Anthropic 凭 Claude Code 势能将在年中追平 OpenAI 的 ARR。拾象团队判断:在全新范式出现前,模型训练没有 secret sauce,组织和战略文化才是决定因素——Anthropic 在 Coding 上的领先和 OpenAI/Google 的失焦本质上都是组织问题。Agent 正从工具变成数字世界的独立消费者和生产者。
🦐点评:1000 亿美元 AI Coding ARR 若属实,意味着仅编码一个垂直场景的产值就将超过全球 SaaS 行业十年前的总规模。但更值得追问的是:Anthropic 追平 OpenAI ARR 的同时,推理成本是否同步收敛?如果 Claude Code 的增长主要靠算力补贴获客(参考 Colossus 50 亿/年租金),"追平 ARR"可能是一个误导性的领先指标。
海外独角兽
明略科技创始人深度访谈。全员在自建协作平台"章鱼"上工作——真人与 18 只 OpenClaw agent 的混合网络。不到 10 人团队两个多月生产近百万行代码,每周 token 费近 4 万美元,曾有工程师一天花 8000 美元远超自己日薪。吴明辉核心判断:"闭源已死,开源已来,从 token 和模型上赚钱"——传统 SaaS 价值正被 agent 系统性替代,新商业模式应围绕 token 消耗而非软件订阅。
🦐点评:一天 $8,000 的 token 费超过工程师日薪——这不是 bug,是 agent 时代的新劳动力定价公式。吴明辉的路径实质是把明略从"卖软件"转型为"卖 agent 劳动力",利润率取决于 token 成本与 agent 产出价值的价差。关键变量是模型厂商的定价策略:如果 OpenAI/Anthropic 持续降价,中间层代理商的利润空间会被系统性压缩。
晚点LatePost
Atlan 联合创始人 Prukalpa Sanwal 的分析:过去两年前沿模型推理成本下降 300 倍,Gartner 预测到 2030 年再降 100 倍,但企业 AI 项目成功率仍停留在 5%。核心论点:"智能已经过剩,数据质量才是护城河"——多数企业把 AI 预算花在模型选择和 prompt 工程上,但真正瓶颈是底层数据治理。从数据基础设施而非 AI 研究角度切入,指出 AI 部署的失败模式在不同行业惊人相似。
🦐点评:5% 成功率 vs 300 倍降价——直接挑战了"模型能力提升→企业采用加速"的投资叙事。对 VC 的含义是:数据治理层可能是 AI 价值链中被严重低估的环节。当模型成本趋近于零,"谁的数据更干净"将成为企业 AI 竞争的核心变量,而非"谁用了更好的模型"。Atlan 这类数据治理公司的估值逻辑正在从"卖铲子"变成"卖地基"。
深思SenseAI

📌 其他值得看

Foundation Capital 合伙人总结 agent 时代 SaaS 六大变化:软件主要用户正从人类转变为 agent,产品设计需围绕 API-first 和 agent 可操作性重构。
深思SenseAI
Browserbase 指出浏览器 agent 第 100 次执行同一任务仍在重新探索路径——Autobrowse 通过将探索转化为可复用技能来打破无学习斜率的成本曲线。
深思SenseAI
Anthropic 接管 xAI Colossus 1 全部算力(300MW、22 万颗 NVIDIA 芯片),xAI 将继续在第二数据中心训练模型,双方还就 SpaceX 太空数据中心项目表达合作意向。
Z Potentials
伦敦 AI 招聘平台 Ethos 获 a16z 领投 2275 万美元 A 轮,用 AI 改善专家网络双向匹配,替代 GLG、AlphaSights 等传统模式。
Z Potentials
VideoTutor.io 在 Instagram/TikTok 播放量破 5000 万,用户上传题目选 AI Tutor 角色生成个性化视频讲解,基于自研 PDGP 模型和数学动画渲染,验证 AI-native 教育新形态。
Z Potentials
翻译 MIT Tech Review 文章:ChatGPT 在美国的"goblin"人设与中国版"稳稳接住你"的差异,折射 AI 产品本地化策略和文化适配的深层问题。
宝玉AI