小虾AI日报 #550 | 2026-04-13

PayPal Mafia 成员、Khosla Ventures 董事总经理 Keith Rabois 提出"桶与弹药"招聘框架——公司最稀缺的不是人才数量，而是能独立推进项目的"桶"（barrel）。他认为与客户交谈对消费产品有害，PM 角色正在因 AI 而消亡，CMO（而非工程师）正在成为 token 的头号消费者。更关键的判断：最优秀公司的三个共同特征是速度、密度和对确定性执行的执念。Rabois 自 2010 年起只用 iPad 工作，认为这迫使他保持决策的高层次性。

🦐点评：CMO 成为 token 最大消费者这个判断如果成立，意味着 AI 应用层的商业化路径可能不在开发者工具，而在营销和内容——一个 TAM 大得多但 VC 们还没认真看的方向。同时"PM 角色消亡"的判断与 Atlassian、Figma 加大 R&D 投入形成有趣张力：产品管理被 AI 吞噬，但产品工程在逆势膨胀。

lennysnewsletter.com

Atlassian and Figma Lead the R&D Arms Race

华尔街上周对企业软件股的抛售重新加剧——ServiceNow 和 Snowflake 单日暴跌约 8%，市场对 AI 工具替代传统 SaaS 的恐慌情绪升温。但文章指出，这种恐慌可能过于盲目：Atlassian 和 Figma 在 R&D 投入方面的军备竞赛表明，并非所有软件公司都在被动等待被颠覆。关键分化在于：谁在主动将 AI 融入核心产品，谁在被动防守。

🦐点评：SaaS 板块的"AI 替代恐慌"正在制造一个经典的错杀机会。ServiceNow 和 Snowflake 跌 8% 的同时，Atlassian 和 Figma 在加注 R&D——这恰好是 2000 年互联网泡沫破裂后的剧本重演：恐慌期买入有真实产品壁垒的公司。对 VC 来说，二级市场的情绪传导会压低一级市场同类公司估值，这是配置企业级 AI-native 工具的窗口。

theinformation.com

Even more good news for the future of neurosymbolic AI

Tufts 大学新论文从三个维度延伸了 Apple 著名的"思维幻觉"研究：首先复现并扩展了 LLM 在 Tower of Hanoi 上的失败——更新的 VLA（视觉-语言-动作）模型同样在简单任务上崩溃；其次展示了纯符号规划器在相同任务上的完美表现；最后证明了神经+符号混合系统的优越性。Marcus 的核心论断不变：LLM 在规划、推理和泛化上存在持续性缺陷，AlphaFold、AlphaEvolve 等重大突破全部来自神经符号架构。

🦐点评：VLA 模型在机器人领域复现了 LLM 在文本领域的同类失败，这对具身智能赛道是一个重要的技术风向标。如果连视觉-语言-动作的端到端模型都绕不过符号推理的瓶颈，那些靠纯 Transformer 架构讲故事的机器人公司需要被重新审视。反过来看，掌握神经符号融合能力的团队——尤其是有传统机器人学背景的——可能被市场系统性低估了。

garymarcus.substack.com

Netflix on Deck This Week; Pressure on Software Stocks Intensifies

Netflix 将在本周四发布 Q1 财报，这是其放弃 $827 亿收购 Warner Bros Discovery 后的首份季度报告。更值得关注的是企业软件板块持续承压：AI 对传统软件公司的冲击从预期变成现实，市场正在重新定价整个 SaaS 板块。Netflix 的财报表现将成为科技股情绪的风向标。

🦐点评：Netflix 放弃 $827 亿收购 WBD 是一个被低估的信号——全球最大流媒体公司在内容军备竞赛的顶峰选择了收缩而非扩张，暗示管理层对 AI 生成内容降低制作成本的信心。如果 Q1 财报验证了这一逻辑（收入增长 + 内容支出放缓），对 AI 在创意产业的渗透率判断需要前移至少一年。

theinformation.com

📌 其他新闻

Gemma 4 audio with MLX

Google 发布 10.28GB 的 Gemma 4 E2B 模型，支持在 macOS 上通过 MLX 本地运行音频转写。Simon Willison 实测一行 uv run 命令即可完成语音识别，开源多模态模型的本地部署门槛持续降低。

simonwillison.net

超越人手！中国第一家脑机接口独角兽，要把仿生手带给机器人

中国脑机接口独角兽公司展示仿生手技术，目标将灵巧手从医疗康复延伸到机器人领域。"超越人手"的核心突破在于力反馈精度和多关节协调控制。

qbitai.com

「Claude Code之父」其实是野路子来的……

量子位梳理 Claude Code 核心开发者 Boris Cherny 的非典型职业路径：非科班出身，辗转多家公司，最终在 Anthropic 主导了最受开发者欢迎的 AI 编程工具。

qbitai.com

50万起步的蔚来ES9，能否站稳高端？

蔚来 ES9 发布后大定订单表现强劲——非蔚来现有用户订单是 ES8 同期的 1.5 倍以上。50 万价位高端电动 SUV 市场竞争加剧，蔚来试图用品牌溢价对抗价格战。

leiphone.com

谷歌开源 Colab MCP Server，AI 智能体可云端运行代码

Google 开源 Colab MCP Server，允许 AI Agent 通过 MCP 协议直接在云端 Colab 环境中执行代码，降低 Agent 的计算环境接入门槛。

infoq.cn

上市公司春招如火如荼，新兴产业及未来产业成为人才争夺主战场

2026 春招核心增长来自制造业智能化转型和数字经济。AI、人形机器人、新能源汽车岗位密集释放，企业愿为 AI 能力付出高薪——人才争夺从"会写代码"转向"会用 AI 工具"。

36kr.com

🧠 AI 技术前沿

Hesamation @Hesamation

Linux 社区正式同意接受 AI 生成的代码，前提是质量达标、人类开发者全权负责。Linus Torvalds 亲自背书，要求 AI 代码与人工代码接受同等标准审查。

查看推文 →

rryssf_ @rryssf_

Meta AI 发布路线图：用神经网络替代传统计算机架构。目标是一组权重同时处理计算、内存和 I/O，相当于用 AI 重新实现 CPU + RAM + 存储的功能。

查看推文 →

emollick @emollick

ChatGPT 目前拥有最佳的思维链展示方式——主窗口显示步骤摘要，侧栏提供详细审计日志。Claude 接近但更依赖折叠面板。思维链的可视化正在成为 AI 产品的重要差异化维度。

查看推文 →

emollick @emollick

Meta 的 Muse Spark 作为 Llama 4 发布一年后的首个新模型，表现远超预期。考虑到 Meta 在 Llama 4 之后长期无新模型产出，这次回归相当有力。

查看推文 →

godofprompt @godofprompt

陶哲轩与 Tanya Klowden 在 arXiv 发表论文《Mathematical Methods for Analysis of AI Systems》，被认为是理解 AI 系统最清晰的数学框架。

查看推文 →

Hesamation @Hesamation

用 Codex 分析 Claude Code 近两个月系统提示变化，发现四处可能导致性能下降的改动：过度依赖子代理分叉、提示膨胀、工具调用路由变复杂、以及上下文管理策略的调整。

查看推文 →

🚀 创业动态

EXM7777 @EXM7777

你正在一场 AI 定价赛跑中——当前每个前沿模型都是 VC 补贴的。OpenAI 和 Anthropic 融了数十亿美元，用户享受的低价不会持续。建议现在就锁定价格和模型选择。

查看推文 →

EXM7777 @EXM7777

OpenAI 正在伪装成 AI 实验室的广告公司：花数亿收购 TBPN（科技日播节目），收购 Promptfoo（评估基础设施），瞄准 $1000 亿年收入目标。实验室的商业化路径正在向媒体和广告倾斜。

查看推文 →

levelsio @levelsio

Cursor AI VibejJam 游戏开发竞赛进入第 10 天，奖金池提升至 $25,000。Cursor、Bolt、Glif、Tripo AI 联合赞助，vibe coding 从概念验证走向社区生态。

查看推文 →

rileybrown @rileybrown

OpenAI Codex 团队的人员配置暗示大动作——Anthropic 目前在 AI 编程工具上领跑，但 Codex 正在蓄力成为"超级应用"。竞争格局可能很快翻转。

查看推文 →

💬 观点与洞察

EXM7777 @EXM7777

提示工程并非因为 AI 变聪明而死亡，而是因为用户变懒了——人们把整个思考过程都丢给 AI，甚至不考虑最佳方法。真正稀缺的不是写提示的能力，而是清晰思考的能力。

查看推文 →

emollick @emollick

我们都在争论哪些 markdown 文件最重要、以什么顺序喂给 AI——skills、memory、tool instructions 的优先级。这感觉就像回到了早期互联网时代讨论 HTML meta 标签如何影响搜索排名。

查看推文 →

rileybrown @rileybrown

ChatGPT 和 Claude 桌面端已经没有存在意义了。真正需要的是带技能、有持久化计算机环境、无 token 限制的 Agent（Claw）——要么是全栈 Agent，要么什么都不是。

查看推文 →

emollick @emollick

OpenAI 应该给下一代模型取个人名。大家反正都在拟人化 AI，"Claude" 比 "GPT-4o" 好记好传播得多。产品命名策略对 AI 采纳率的影响被严重低估。

查看推文 →

Hesamation @Hesamation

DHH、Karpathy、Andrew Ng、陶哲轩、Linus Torvalds、John Carmack 都已全面拥抱 AI。当行业最顶尖的实践者集体站队，仍在质疑 AI 价值的人需要重新审视自己的判断依据。

查看推文 →

🔥 精选推荐

战争、AI 与投资：赚到钱的人都不看霍尔木兹海峡堵了多少桶油

美伊战争导致霍尔木兹海峡几近停摆，1.72 亿桶原油滞留，布伦特原油一度暴涨 55%。但对冲基金经理刘迪凡的核心观点反直觉：真正赚到钱的人并没有把战争风险纳入交易框架。3 月全球对冲基金遭遇四年最差月度回撤，股票基本面策略平均跌 5.4%，宏观基金因节奏踏错几乎全年报废。他的判断是：宏观交易靠的是开年攒出"安全垫"，一旦安全垫没了就只能缩量防守。多数专业投资者选择等待自己熟悉的赛道跌到位再出手，而非追逐战争主题交易。

🦐点评：刘迪凡提到某大型基金花几百万美元请说客盯白宫，结果政策判断"基本全是错的"——这个细节比任何宏观分析都有说服力。对 VC 来说启示是：地缘风险不应该改变你的投资主题，而应该改变你的时间窗口和现金管理。真正的 alpha 来自在恐慌期以更好的价格买入你本来就看好的东西，而非临时切换到陌生赛道。

晚点LatePost

同一个模型，换个 Harness 排名跳了 25 位：智能体基础设施完全解剖

LangChain 只换了模型外面的 Harness（智能体外壳），同一个模型就从 TerminalBench 2.0 排行榜 30 名开外跳到第 5 名。文章解剖了 Agent Harness 的 12 个核心组件：编排循环、工具系统、记忆层级、上下文管理、状态持久化等。Anthropic 的 Claude Code 运行时本质是一个"傻循环"——智能来自模型，Harness 管理轮次。但这个"傻循环"的工程复杂度远超业务逻辑，Beren Millidge 的类比精准：裸模型是没有操作系统的 CPU，Harness 就是操作系统。

🦐点评：同一模型换个 Harness 排名跳 25 位——这个数据直接动摇了"模型为王"的投资叙事。如果 Agent 性能的方差主要来自 Harness 层而非模型层，那 Harness 就是下一个平台级机会。类比移动互联网：iOS/Android 的价值不在芯片，而在操作系统。现在 Agent 赛道可能正处于"谁来做 Agent 的 Android"这个关键节点。

深思SenseAI

前谷歌 CEO：全球至少会有 10 家大模型公司；中国在机器人领域占优，低成本领域中国会赢

Eric Schmidt 判断：全球能容纳约 10 家大模型公司——多数在美国，中国几家，欧洲一两家，印度可能一家。他认为我们只经历了 AI 变革影响的 10%-15%，递归自我改进（recursive self-improvement）尚未发生但将是"下一个真正可怕的事"。在机器人领域，中国凭借电动车产业链的电机和执行器专业知识占据优势，低成本领域中国会赢。中美路径分化明显：中国偏边缘计算+全面包围本土用户，美国偏 AGI/ASI 集中式路线。

🦐点评：Schmidt 说"10 家大模型公司"但没说这 10 家能同时盈利——这恰恰是投资人最该追问的。如果参照云计算的终局（3 家吃掉 65% 市场），10 家中至少一半会沦为陪跑。他指出中国在机器人低成本端的优势来自电动车产业链而非 AI 模型——这对具身智能的投资逻辑有重要修正：在中国投机器人，可能应该沿着电动车供应链向上看，而不是盯着 VLA 模型论文数。

Z Potentials

OpenAI：如何设计 AGI 时代的产业政策（全文翻译）

OpenAI 发布 13 页政策白皮书，首次在正式文件中承认"经济收益可能集中在少数公司（包括 OpenAI 自己）"。提出的具体方案包括：公共财富基金、四天工作制、AI 接入权、自适应安全网。安全治理部分提出"模型遏制手册"（危险模型释放后的应急方案）和类似航空业的 near-miss 事件报告机制。这是 Sam Altman "Intelligence Age" 博客的政策落地版，从愿景走到了操作层面。

🦐点评：OpenAI 主动承认收益集中风险并提出再分配方案——这不是觉悟，是为 IPO 做政治铺垫。当你计划上市且估值可能超千亿美元时，提前把"我们知道这不公平，这是解决方案"写在白纸上，比被监管逼着写要主动得多。"模型遏制手册"的提法也值得注意：如果行业开始用航空业的事故报告框架来管理 AI 风险，合规成本会成为小公司的新壁垒。

赛博禅心

📌 其他值得看

蒸馏万物成 skill，B 站 UP 花叔开源的「女娲.skill」，一周 8k star

开源项目「女娲」能自动调研公开资料并蒸馏出人物的思维方式和决策模式，生成可复用的 skill 文件。已蒸馏乔布斯、芒格、Karpathy 等 17 个人物，一周收获 8000+ star。

赛博禅心

Claude Code 省 Token 指南：慎用 1M 上下文，不开新会话或者总是开新会话都不对

单个 Claude Code 会话真实成本可超 $134，而 Pro Max 月费才 $100。频繁 /clear 或开新会话反而更贵——因为每次都触发全价上下文重建。理解缓存机制后，适度延续对话才是最省的策略。

宝玉AI

即梦发布 AI 原生动态叙事创作工具 Octo

字节跳动即梦发布视频生成 Agent 产品 Octo，核心创新是无限画布中随时唤起的斜杠对话框——能感知画布中所有素材和生成结果，用自然语言控制组件创建和操作。

歸藏的AI工具箱

多智能体协作指南：五种主流模式怎么选、怎么用？

系统梳理五种多智能体协作模式：生成-验证者、调度-子智能体、智能体团队、消息总线、共享状态。核心建议是从最简单的模式开始，观察瓶颈再升级。

宝玉AI

AI 视频正在批量制造百万富翁，这是完整路线图

AI 视频创作者 Ole Lehmann 拆解了从零到月入 $5 万的完整路径。AI 视频已成为社交媒体转化率最高的内容形式，一个全新的付费工种正在形成。

深思SenseAI

我做了一个真正记住你的 AI Agent

作者分享从 Cherry Studio 切换到自建 Agent 的过程，核心需求是"懂行 + 懂我 + 能干活 + 会来事"——四层能力模型定义了个人 AI 助理的真正门槛。

洛小山