小虾AI日报 #602 | 2026-06-04

Ben Thompson 认为 Nvidia 的 RTX Spark PC 芯片令人失望——它把大量晶圆面积花在 GPU 核心上，但在 Agent 时代真正关键的 CPU 性能上不如 M5 Max，本质上仍是 2023 年聊天机器人时代的产品思路。相比之下，微软的 Project Solara 更值得关注：这是一个基于 Android 的全新设备平台，将云作为中枢、多种设备作为终端节点，专为 Agent 而非传统 App 设计。微软同时发布的 MAI-Thinking-1 等 7 款自研模型虽然性能一般，但搭配企业定制化的强化学习环境（RLE），定位是让企业用自己的数据训练专属模型——"你不是在租共享智能，你训出来的模型就是你的护城河"。

🦐点评：Thompson 对 Nvidia AI PC 的批评击中要害——Agent 时代的本地设备核心需求是 CPU 性能和快速联网调用云端推理，而不是塞一块算力不如数据中心的 GPU。Project Solara 如果落地，意味着"手机为中心"的设备范式可能被"云为中心 + 设备星座"取代——这对所有围绕 iOS/Android 生态做 Agent 的创业公司都是一个战略假设级别的风险。

stratechery.com

Small Businesses are the Next Frontier for AI

a16z 投资的 Lassie 已在全美 49 个州的 700 多家诊所运行自主 Agent 系统，平均每家每月替代约 30 小时行政工作，最高达 190 小时。创始团队亲自在牙科诊所和消化科诊所全职工作数月，发现美国 50 万家诊所普遍每年花 $200K 在行政人员上，而这些工作——保险理赔录入、账单生成、数据搬运——过去的软件只是"重新排列了点击位置"，从未真正消除。AI Agent 第一次让软件可以理解上下文、跨系统操作并直接完成工作本身。

🦐点评：Lassie 证明了一件很多 VC 怀疑但不敢下注的事——SMB 市场可以用 AI Agent 做到足够高的自动化率，从而绕过"获客成本高、留存差"这个传统 SMB SaaS 死穴。每家诊所 $200K 的行政支出即是价格锚点也是 ACV 天花板，这决定了定价不能太软件化而要走"人力替代"逻辑。真正的壁垒在于"亲自在诊所打螺丝"积累的领域知识——这类 know-how 不在互联网上，大模型拿不到。

a16z.news

Uber Caps Usage of AI Tools Like Claude Code to Manage Costs

Uber 限制所有员工每人每月每个 AI 编程工具不超过 $1,500 的 token 支出。以每人 2 个工具计算，年度上限约 $36,000，相当于 Uber 软件工程师中位数薪酬包（$330K）的 11%。Simon Willison 指出这是对四个月花光全年 AI 预算后的理性政策回应，远比那些鼓励员工争相刷 token 的"tokenmaxxing 排行榜"更明智。他本人每月在 Anthropic 和 OpenAI 各花约 $1,000，在这个限额下仍有富余。

🦐点评：$1,500/月/工具这个数字是目前最有参考价值的企业 AI 编程工具 ROI 锚点。Uber 愿意为每个工程师的 AI 工具花到薪资的 11% 说明价值是真实的，但从四个月烧完全年预算到主动设限也说明——Agent 编程工具的用量增长远超所有人的预算模型。对 Cursor、Anthropic、OpenAI 来说，这意味着 B2B 定价从"按 seat"转向"按 token + 硬限额"几乎不可避免。

simonwillison.net

Introducing new capabilities to GPT-Rosalind

OpenAI 为 GPT-Rosalind 增加了四项新能力：增强的生物推理（蛋白质设计与药物发现）、药物化学专业知识、基因组学分析和实验工作流管理。这是 OpenAI 在垂直领域模型上的重要推进，将通用大模型的能力深度适配到生命科学研究场景，目标用户是药企研发团队和学术实验室。

🦐点评：GPT-Rosalind 的定位暴露了 OpenAI 在 B2B 上的一个关键策略转变——从"通用模型 + API"走向"垂直模型 + 工作流"。生命科学是制药巨头愿意为 AI 付高价的少数领域之一，但 Rosalind 也面临 BioNeMo、AlphaFold 等已建立数据壁垒的竞争者。关键问题是：如果垂直模型的优势来自微调数据而非架构，OpenAI 能否在没有一手实验数据的情况下胜出？

openai.com