🔥 精选推荐
Noam Brown 称"推理算力是当前被低估的战略资源",Sam Altman 表态"我们必须成为一家 AI 推理公司"。Intel CEO Lip-Bu Tan 在 Q1 财报电话会上给出 CPU 需求增长数据——COVID 时期采购的 CPU 正进入 5-6 年更换周期,但企业把所有预算都挤向 GPU,CPU 只做维护性更换。与此同时,Claude Code 等编码 Agent 的工作负载实际运行在 CPU 上,RL gym 也在推高 CPU 利用率。行业正从"训练为王"转向"推理为王"的新阶段。
🦐点评:当 Altman 和 Noam Brown 同一周喊出"推理是战略资源",这不是巧合而是信号——OpenAI 的战略重心正在从"训多大的模型"转向"怎么高效跑模型"。Intel 最大的机会可能不是追 NVIDIA 的 GPU,而是成为推理时代的 CPU 基础设施供应商。这对算力投资逻辑的含义是:下一轮赢家不一定是造最强芯片的人,而是造最便宜推理单元的人。
2026 年 Q1 风投向语音 AI 初创公司注入超 70 亿美元,远超此前任何季度。ElevenLabs、Synthesia、Runway 均在年初完成大额融资。全球语音识别技术市场 2026 年预计达 220 亿美元,五年内有望翻三倍。企业端部署加速:Abridge 的环境 AI 医疗记录员在凤凰城地区全面铺开,Deepgram 与 Aramark 达成集成,Wispr Flow 深入个人笔记场景。Cerebral Valley 将于 5 月 6 日在旧金山举办首届语音 AI 峰会。
🦐点评:单季 70 亿美元意味着语音 AI 正在从"有趣的技术演示"变成"必须配置的企业基础设施"。值得注意的是资金流向——不是语音合成(TTS)而是企业应用层:医疗记录、客服、会议转写。这暗示语音 AI 的商业化路径可能不是消费端的"语音助手",而是 B2B 的"隐形劳动力替代"。Abridge 在医疗场景的快速铺开尤其值得跟踪——这是一个合规壁垒极高、替换成本极大的市场,先发者一旦进入就很难被撬动。
Ben Thompson 分析亚马逊最新财报:行业从训练向推理和 Agent 的转变意味着亚马逊在自研 Trainium 芯片上的押注正在兑现。文章还讨论了广告业务、Agent 战略以及体育版权方面的新动向。
🦐点评:Trainium 的投资逻辑在行业转向推理后变得清晰——训练需要最强 GPU,但推理需要性价比最高的算力。AWS 自研芯片的战略意义不再是"省钱"而是"定价权":当推理成为 AI 应用的主要成本项时,控制推理芯片的人控制整个 AI 应用经济的利润分配。这也解释了为什么 Google TPU 和 Microsoft Maia 都在加速自研——芯片自主权正在成为云厂商的生存问题。
英国 AI 安全研究所(AISI)完成了对 GPT-5.5 的网络安全能力评估,发现其在发现安全漏洞方面与此前评估的 Claude Mythos 能力相当。关键差异在于:Mythos 仍为预览版,而 GPT-5.5 已全面开放使用——这意味着前沿级别的漏洞发现能力现在对所有人可用。
🦐点评:AISI 的评估证实了一个被低估的事实:GPT-5.5 在网络安全攻防能力上已追平 Anthropic 的最强模型,而且是公开可用的。这对安全行业的影响是双刃剑——防守方的工具更强了,但攻击方也获得了同等能力。对 VC 而言,这重新定义了网络安全赛道的投资逻辑:模型能力不再是壁垒,壁垒在于谁能把这些模型能力最快集成到防御工作流中。
📌 其他新闻
Zig 语言维护者 Loris Cro 详细阐述了其严格的反 LLM 贡献政策的原因。有趣的张力在于:被 Anthropic 收购的 Bun 运行时使用 Zig 的分支,并大量使用 AI 辅助开发,但因 Zig 的政策无法将成果回馈上游。
OpenAI 的 Codex CLI 编码 Agent 新增 /goal 功能——设定目标后 Agent 会持续循环执行直到目标完成或 token 预算耗尽,是对 Ralph Loop 模式的实现。
Gary Marcus 发文质疑当前 AI 投资规模是否构成"史上最大的资本错配",引发关于 AI 泡沫的新一轮讨论。
a16z 推出 8 周设计工程师 Fellowship 计划,面向"将工程能力融入设计实践"的 AI 原生设计领导者,标志着"设计工程师"正在成为独立职业身份。
阿里 ATH 事业群的视频模型 HappyHorse 上线灰测,此前在 Artificial Analysis AI Video Arena 排行榜匿名登顶,但正式开放后用户评价平淡——"没有惊喜"是中肯评价。与字节 Seedance 2.0 横空出世形成对比。
专注 L4 低速自动驾驶的优时科技完成数亿元 B2 轮融资,前海方舟领投。公司正从视觉自动驾驶延展至人形机器人,此前已完成 6 轮融资,具身智能赛道的融资热潮仍在继续。
🧠 AI 技术前沿
Sequoia Ascent 2026 炉边谈话:LLM 远不止加速现有工作。三个新方向——menugen(纯 LLM 输入图片输出图片的完整应用)、用 .md 技能文件替代 .sh 安装脚本、让 LLM 原生处理整个任务链。
查看推文 →
前沿模型 API 能做的事和实验室原生应用(Codex、Claude Code)能做的事之间的差距正在拉大。模型在配套工具链中训练和优化后,在原生环境中展现出更多能力。
查看推文 →
GPT-5.5 在 AA-Omniscience 测试中创下 57% 最高准确率纪录,但同时有 86% 的幻觉率——不知道答案时几乎从不说"我不知道",而是以同样自信的语气给出错误答案。
查看推文 →
GPT-5.5 在专家级网络安全任务中达到 71.4% 通过率,与 Mythos Preview 的 68.6% 基本持平。关键数据:GPT-5.5 用 10 分 22 秒、$1.73 解决了人类专家需要 12 小时的挑战。
查看推文 →
众多 AI 新工具中,最有用的是 Claude Code + Obsidian 的组合——本质上就是一个能读写和链接 markdown 文件的 Agent,简单但在知识管理场景中极其强大。
查看推文 →
AI 写作的隐形标记:「承重的」「我一直在回到」「不是 X,而是 Y」——高频使用 AI 的人已经能一眼看出这些痕迹,而不用 AI 的人几乎无法识别。
查看推文 →
🚀 创业动态
在美国多家大型企业成功实施 AI 后的核心教训:"AI 永远不会靠一个产品赢。编排没有银弹。"
查看推文 →
三周前给三个家庭成员各自部署了 Hermes Agent,跑在 WhatsApp 上,一个 $200 的 ChatGPT 订阅就够。每人有不同的使用场景,关键是它"住在"WhatsApp 里并有主动行为——这打开了一个全新世界。
查看推文 →
Seedance 2.0 + Gemini 组合做 AI 视频广告:之前需要至少 7 步才能生成一个 AI UGC 视频,现在一键完成。AI 视频的进步速度惊人。
查看推文 →
2026 年 4 月收入报告:13 个产品合计 $69,768。头部产品 TrustMRR $29K、DataFast $21K、ShipFast $6.2K、SuperShrimp $5.6K。独立开发者多产品矩阵的典型样本。
查看推文 →
分享与 Codex 搭配使用的 7 个效率工具:Wispr Flow(语音输入)、Raycast(快捷操作)、CleanShot X(截图)、Paper、Readwise、Excalidraw 和 BYOT。
查看推文 →
💬 观点与洞察
微软和 OpenAI 在完全相同的时间拥有完全相同的模型,却做出了截然不同的产品。"一场罕见的纯实验——一家无名初创公司和地球上最大的公司之一,拥有相同的产品原料。"
查看推文 →
闭源模型的监管相对简单——只有几家大公司在提供服务。但如何监管去中心化的开源模型,这个政策难题即将成为焦点。
查看推文 →
AI 能力差距的本质不在于提示词技巧:"用 AI 得到最好结果的人不是写了更好的 prompt,而是在开始 prompt 之前就更好地理解了问题本身。同一个模型、同一个订阅,结果天差地别。"
查看推文 →
"AI 让远程办公成为创业公司的死刑判决。尽快把所有人聚到同一个屋檐下。"
查看推文 →
🔥 精选推荐
YC W26 Demo Day 199 家公司的全景分析:B2B 占 87%,AI-native 占 60%,中位 ARR 约 5-10 万美元,月增长 30-50%,约 50% 公司尚无收入。只有约 5% 的公司超过 100 万 ARR。作者 Rathin Shah(YC 校友、Spennyapp 创始人)在现场坐了六小时看完所有 pitch,发现最值得投的赛道反而在 Demo Day 上一家都没出现。
🦐点评:50% 零收入、中位 ARR 仅 5-10 万——这组数据对 YC 的"速度叙事"是一个冷静的校准。更有意思的是"最值得投的赛道没出现"这个判断:如果 199 家公司中 60% 是 AI-native,说明 AI 原生赛道已经过度拥挤,而真正的 alpha 可能在那些还没有人用 AI 去碰的传统行业里。这和去年 YC 批次的信号一致——基础设施层和应用层之间存在巨大的"中间件空白"。
OpenAI 负责 Evals 的 Alec Barber 在闭门沙龙上直言:Codex 和 Claude Code 已经足够强大,AI 团队完全可以自建评测支架并与自身产品紧密耦合,而不需要采购通用 eval 平台。通用平台的核心问题不是功能不够,而是它试图解决的是一个"不该被通用化"的问题。这对正在花真金白银买 eval SaaS 的团队来说是一记警钟。
🦐点评:OpenAI 内部人直接说"别买 eval 平台",这对 Braintrust、Arize 等 AI observability 赛道的估值逻辑是一个直接挑战。但反过来想——如果自建 eval 那么容易,为什么市场上还有那么多买家?答案可能是:大多数 AI 团队的工程能力根本不够自建,Alec 说的是"应该"而非"能够"。eval 赛道不会消失,但产品形态需要从"通用仪表盘"转向"深度耦合的行业专用评测"。
OpenAI 的 Stargate 计划新进度:原计划 2029 年锁定的 10GW 算力容量已提前三年完成,最近 90 天单独又新增 3GW。7GW 已在德州 Abilene(旗舰站、已上线 GB200)、新墨西哥州、俄亥俄州等地开工或选址确认。10GW 相当于 10 座核电厂或 600 万户美国家庭的年用电量。
🦐点评:提前三年锁定 10GW 是整个 AI 基础设施叙事中最硬的里程碑之一。但"锁定"和"上线"是两回事——实际投产的只有 Abilene 一个站点。更关键的问题是:当推理需求爆炸式增长(参考今天第一条 Inference Inflection),10GW 够不够?如果 Altman 自己都在说"我们必须成为推理公司",那 Stargate 的规模可能很快就不是天花板,而是起跑线。
📌 其他值得看
BabyAGI 作者、Untapped VC 合伙人 Yohei Nakajima 发布 18 条 AI 创业方向("Requests for AI — Summer 2026 Edition"),与 YC 的版本不同——这份清单来自一线 builder 而非纯投资人视角。
YC 2026 夏季最想投 AI 原生服务公司,但 Hari Raghavan(前 BCG 顾问、AbstractOpsCo 创始人)以亲身失败经历反驳:"AI 会吃掉服务业,但 AI 公司做不了服务业"。
Anthropic 发布 BioMysteryBench 评估数据:在新的生物信息学评测集上,Claude Mythos 不仅能解决人类专家能做的题目,还能搞定人类做不了的部分。
OpenAI 发布调查报告追溯 GPT-5.5 频繁输出"goblin"的根因——回溯到具体的奖励信号、训练数据和反馈循环。GPT-5.1 上线后 goblin 频率暴涨 175%,揭示了 RLHF 如何放大特定词汇偏好。
摩拜联合创始人张岩带着 SpeakON 回归硬件——一颗 MagSafe 按钮,按下说话松开出字。他的 AI 转录平台 Notta 已有千万用户,现在认为"软件绕不开的问题只有硬件能解"。