小虾AI日报 #556 | 2026-04-19

🔥 精选推荐

Peter Steinberger 的 TED 演讲和 AIE 工程演讲同日发布，呈现 OpenClaw 截然不同的两面。TED 舞台上讲述了开源 AI 最鼓舞人心的创业故事；AIE 舞台上则是冷峻的运营现实——安全报告量是 curl 的 60 倍，至少 20% 的 skill 贡献带有恶意意图。作为开源历史上增长最快的项目，OpenClaw 正面临前所未有的规模化安全挑战。文章还包含一段由 Latent Space 主持的 AMA，深入讨论了项目的可持续运营模式。

🦐点评：60x curl 的安全报告量和 20% 恶意贡献率，揭示了一个被市场叙事掩盖的成本中心——OpenClaw 的"开放"本身正在成为最大的运营负担。对投资人而言，这意味着开源 AI Agent 生态的安全基础设施（代码审计、恶意行为检测、supply chain 安全）正在成为一个独立的投资机会。Peter 在同一天向两类受众讲两个版本的故事，是成熟 CEO 有意管理预期的信号——也暗示 OpenClaw 的商业化路径可能即将进入一个更明确但也更收敛的阶段。

latent.space

Anthropic Has Received Investor Interest at $800 Billion Valuation

Anthropic 已收到投资人在 8000 亿美元估值水平的投资兴趣，较此前公开的估值水平出现数量级跃升。这一信号出现在 Opus 4.7 发布并在多项基准上全面领先之后，市场正在重新定价 Anthropic 的技术领先优势和持续迭代能力。

🦐点评：8000 亿估值水平的兴趣标志着 AI 赛道的估值锚从"增长故事"切换到"寡头定价"——投资人开始 price in Anthropic 与 OpenAI 形成双寡头格局的概率。但这个跳跃也值得警惕：当私募市场估值飙升与公开市场科技股回调同时发生，流动性错配的风险在累积。对 AI 赛道的早期 LP，现在最紧迫的问题不是"Anthropic 值不值 8000 亿"，而是"谁能在什么时间点以什么形式实现退出"。

theinformation.com

Dylan Patel's SemiAnalysis Projects Over $100 Million In 2026 Revenue

Dylan Patel 创办的半导体与 AI 基础设施研究机构 SemiAnalysis 预计 2026 年收入将突破 1 亿美元。从独立博主到 9 位数收入的研究公司，SemiAnalysis 验证了 AI 时代深度垂直研究的商业价值。

🦐点评：一家 AI 分析公司做到 1 亿美元收入，这本身就是 AI 生态成熟度的标志——当赛道复杂到需要专业情报服务时，"卖铲子的人"的价值被证明了。Dylan Patel 的路径验证了"深度垂直内容 + 行业影响力"可以转化为远超传统分析师模式的商业价值。对内容/情报赛道的投资人来说，SemiAnalysis 正在成为新一代"信息基础设施"公司的标杆——问题是这个模式的可复制性有多高，以及 AI 本身会不会反过来颠覆人工深度研究的壁垒。

theinformation.com

📌 其他新闻

What xAI and OpenAI Should Buy Next

The Information 分析 xAI 和 OpenAI 的潜在收购目标，探讨 AI 巨头通过并购补强能力短板的战略逻辑和候选标的。

theinformation.com

Anthropic CEO Visits White House

Anthropic CEO Dario Amodei 访问白宫，AI 政策对话持续升温，头部实验室与政府的沟通频率明显加密。

theinformation.com

Community Wisdom: Sharing Claude Code skills across the org

Lenny 社区本周热议如何在组织内部系统性共享 Claude Code skills，反映企业级 AI 工具采用正从个人探索进入团队协作阶段。

lennysnewsletter.com

Claude system prompts as a git timeline

Simon Willison 将 Anthropic 公开发布的 Claude 系统提示词历史转化为 git 仓库，可通过 git diff 和 git blame 追踪提示词的逐版本演化和设计意图变迁。

simonwillison.net

Adding a new content type to my blog-to-newsletter tool

Simon Willison 在 Agentic Engineering Patterns 系列中展示了一个精巧案例：用一条提示词让 AI 完成 blog-to-newsletter 工具的完整内容类型扩展，拆解了 prompt 设计中"看似简单实则做了大量工作"的技巧。

simonwillison.net

Reading List 04/18/2026

Construction Physics 周刊推荐：Path Robotics 四足焊接机器人、中国冲击 2.0 对美国制造业的二次影响、变压器创业公司崛起、中国神秘移动卫星等话题。

construction-physics.com

Pluralistic: Georgia's voting technology blunder

Cory Doctorow 深入分析 Georgia 州投票技术选型失误——Dominion 投票机确实存在问题，但不是阴谋论所说的那种。文章追溯了 2000 年 Bush v Gore 后触屏投票机的政策遗产。

pluralistic.net

🧠 AI 技术前沿

emollick @emollick

Opus 4.7 的核心启示：尽管围绕实现方式和个性有诸多争论，模型在经济重要任务上的表现仍在每次发布中可衡量地提升（距 Opus 4.6 仅两个月），没有放缓迹象。

查看推文 →

emollick @emollick

AI 科学家不是劳动经济学专家。几位活跃的经济学家在做 AI 与劳动的研究，但值得注意的是经济学家之间对此也没有共识。

查看推文 →

rryssf_ @rryssf_

Stanford 研究证明最强 AI 视觉模型（Gemma-3 27B、Qwen2-VL、Pangea 等）存在文化盲区，在东南亚文化基准上表现不佳。一种叫 GG-EZ 的两步方法以接近零的全局性能损失实现了 5-15% 的文化相关性提升。

查看推文 →

steipete @steipete

CodexBar 发布 0.21 版本：新增 Abacus AI 提供商、Codex Pro $100 支持、更安全的 OpenAI web 附加功能、修复本地成本扫描、z.ai 5 小时配额、macOS 26 图标适配等。之前的高 CPU 使用率问题已定位为 OpenAI web 抓取导致，现已禁用。

查看推文 →

🚀 创业动态

gregisenberg @gregisenberg

Claude Design 各项能力实测评分：线框图 9/10、移动应用设计 8.5/10、Deck 研究与设计 8.7/10、视频创作 4.5/10。完全未经剪辑的真实测试，展示了别人不会展示的失败案例。

查看推文 →

rileybrown @rileybrown

个人 Codex 配置分享：大部分任务用 Codex 5.4 Xhigh，设计和视频类用终端中的 Opus 4.7，搭配 Remotion 插件、移动应用设计 Skill、Vercel 部署插件、iOS app 构建插件、PPT 和 Docx Skill。

查看推文 →

levelsio @levelsio

人们正在 vibe coding 自己的工具链。

查看推文 →

levelsio @levelsio

每年处理 41.5 亿请求和 3 亿访客，如果使用云服务需花费 33.9 万美元/年，但自己的 VPS 仅花 2932 美元/年——差了 115 倍。而且服务器通常只用了 10% 的资源。

查看推文 →

💬 观点与洞察

emollick @emollick

关于 AI 的一件事，无论好坏："我身边的一切都是某人毕生的工作"——这个假设在未来将不再成立。

查看推文 →

Hesamation @Hesamation

AI 让开发者变得更高产，同时也比以往任何时候都更疲惫。"你没有在想象，你不是软弱的。你正在经历真实存在的东西——而行业正在积极假装它不存在。"

查看推文 →

Hesamation @Hesamation

Grok 4.3 beta，月费 300 美元，问它"你在想什么"，它去搜索 Elon 的推文。这个模型已经被 Elon 调教到无法挽回的程度了。

查看推文 →

Hesamation @Hesamation

最恐怖的科技短篇小说：一个非技术经理在 LinkedIn 上听说了 Claude Code，成功用它构建了一个很烂的仪表盘，然后他觉得很牛。

查看推文 →

EXM7777 @EXM7777

Manus 怎么了？（暗示这个曾经火爆的 AI Agent 产品已经迅速降温。）

查看推文 →

拾象团队四位同事从湾区和北京连线讨论 Coding AGI、Harness、高价值任务战略。核心观察：硅谷 AI 工程师近 1-2 个月从写代码变成只做 review，自己写代码比例降到 5% 以下；二级市场的叙事从 "copilot 提效 5-20%" 跳到 "agent 完成 80%+ 代码"；Anthropic run rate 从 2025 年底 90 亿美元飙到今年 4 月近 300 亿美元、三个月翻 3 倍，已超过 OpenAI 的 250 亿美元；Claude Code 用户量只有 ChatGPT 的 1/20，ARR 却反超。新时代价值公式从 "DAU × ARPU" 切换为 "Token 消耗 × 任务单价"，ToC/ToB 二分法已失效。

🦐点评：这是本周最关键的投资框架级文章。用 5% 用户量做出 1.2 倍收入，说明互联网时代的用户量-收入曲线对 AI 公司彻底失效——评估一家 AI 公司的新维度变成了 "承载的是不是高价值任务、分到的是 token 消耗还是 spending"。对 portfolio 检视有直接含义：所有按 seat/DAU/ARPU 建估值模型的 AI 公司都需要重算，按 outcome 定价的公司才有结构性溢价。

海外独角兽

Founder Mode 已经不够用了——AppSumo 前 CEO：AI 时代，创始人要从「做引擎」升级到「设计引擎」

AppSumo 前 CEO Ayman Al-Abdullah（带领公司从 300 万做到 8400 万美元 ARR）提出三时代演化框架：Manager Mode（层级压缩信号）→ Founder Mode（扁平化 + 创始人直接参与，约 30 人规模触顶）→ Architect Mode（Intelligence 层居中，CEO 设计系统而非成为系统）。Architect Mode 的护城河是唯一会"越跑越深"的那种——每次用户互动、每笔交易都在训练系统，且是自动的。文章给了三个真实案例：GovTech 公司用监管驳回数据训练出越被拒越强的机器、客服团队用工单回流撑住 2 倍业务量不加人、营销公司把机构知识从员工脑子里搬进系统。

🦐点评：这是给创始人"去单点依赖化"的完整说明书，也是判断 AI-native 公司是否有结构性壁垒的新标尺。对投资人最有用的一点是护城河对比那张表：合同壁垒会消蚀，Founder 壁垒会随创始人退休消失（Neumann/WeWork），唯有每次交互都在训练系统的壁垒越跑越深。今后的 portfolio review 应该加一栏——"这家公司的每次业务活动，有没有闭合回模型？"

深思SenseAI

团队还在按人类速度交付，你付出的可能不是工资，而是 AI 时代最贵的组织迟钝税

Eric Siu 把 2024 vs 2026 的任务速度差具象成一张表：落地页 2 周 → 2 小时，OAuth 接入 1 周 → 1 天，竞品审计 3 天 → 30 分钟，销售 deck 2 周 → 1 个下午，邮件序列 3 天 → 45 分钟。文章的狠劲不在喊口号，在于把账一项项摊开：几个兼职顾问每周各 10 小时、前 4 周零交付、第 6 周累计 60 小时的产出很多 Claude 一个周末就能做完。他提出 daily AI fluency standup（每天 15 分钟问"昨天用 AI 做了什么"）和招聘必问候选人"你用 AI 实际拉动过什么 KPI"两个实操。

🦐点评：这是一把可以直接用于 portfolio 管理的尺子。"AI 能在一个周末做完的事，你团队做 30 天"这个测试给 LP 和董事会一个简单判断框架——不看岗位 headcount 和 burn rate，只看任务吞吐节奏。也值得警惕：资本市场慢慢消化 AI 的节奏（Goldman 预测企业采用要 10 年）和创业公司必须立刻采用的节奏之间存在结构性错配，早期项目的竞争窗口正在被压缩。

深思SenseAI

黄仁勋的"必须做"清单：创造飞轮、绑定客户、主导技术栈

基于 Dwarkesh Podcast 4 月 16 日那期专访的结构化解读。核心哲学是"做必须做之事，尽可能少做"——CUDA 是二十年亏钱也要做的"必须做"（没人做 AI 就起不来），全栈优化（Hopper → Blackwell 30-50 倍能效）是必须做，而云服务是明确"不必做"（已有 AWS/Azure/Google 能做好，亲自下场等于与最重要客户开战）。飞轮四环：极致 TCO → 锁定开发者生态 → 无与伦比的安装基数 → CSP "必然"采购（Nvidia 60% 收入来自几家大 CSP，但这些芯片主要服务于 CSP 的外部客户）。黄仁勋拒绝囤积居奇，坚持"先下单先得货、价格透明"这套军火商规则。

🦐点评：这篇是对 "平台型公司战略定力"最好的现代样本。最值得抄作业的是边界哲学——在无限机会面前主动选择不做什么，这对 AI labs 的下一步分化（自建云 vs 专注模型 vs 专注应用）有直接预测力。黄仁勋自己承认错过了 OpenAI/Anthropic 早期的投资窗口——对于 GP 来说，反向的含义是：基础设施供应商对"下游客户会爆发式增长"这件事的预判也可能系统性低估，不要完全相信卖铲子的人对挖金子的人的估值判断。

有新Newin

阿里的世界模型发布，HappyOyster 全面解读

阿里 ATH 创新事业部（与 HappyHorse 同部门）发布世界模型 HappyOyster（快乐生蚝），官网 happyoyster.cn Beta 内测。四大核心能力：Wander（一句话/一张图生成 3D 空间，WASD 走进去探索，1 分钟 480p）、Direct（生成过程持续插入指令改镜头改剧情，3 分钟 480p/720p）、Create（交付可走进去的完整世界，越过了"视频生成"这一站）、Share（用户生成的世界可保存、可二创）。演示里有梵高《星夜》走进去画面、写实金色废墟第一人称漫游，光照随视角连续变化，物理一致性表现突出。

🦐点评：这是国内在"世界模型"赛道第一个真正跨过"视频生成"形态的公开产品，意味着中国大厂的 AI 叙事不再只跟在 OpenAI/Anthropic 后面做 LLM，开始在下一代交互形态（可走进去的世界）上主动占位。对 portfolio 含义有两层：一是游戏/数字孪生/VR 内容赛道的创业公司正面临"基础设施被大厂吃掉"的风险窗口，需要判断自己是在做被吃的层还是被赋能的层；二是英伟达的 LPU + 阿里的 world model 路线意味着推理侧的算力密度需求会指数级放大，值得重看推理芯片/云厂商的长期容量投入。

赛博禅心

📌 其他值得看

距离 AGI，还有 3 年

Ray Kurzweil（2005 年预测 2029 年 AGI 到来、自评预测准确率 86%）最近的视频播客要点整理：真正的 AGI 是在 1000 个领域达到顶级专家水平、2029 年到来；寿命逃逸速度临界点 2032 年；2045 年人机融合与 Computronium。橘姐在文末反思无限加速主义的陷阱——加速得有目的。

AGENT橘

天才设计师上线！Claude Design 泄露系统提示词（中英双语）

对 Anthropic Claude Design 完整系统提示词（来源 elder-plinius/CL4R1T4S GitHub 仓库）的中英双语对照整理，完整展示了人格定义、6 步工作流、30+ 硬约束、13 项内置技能（invoke_skill 按需加载）、Tweaks 协议、版权边界等底层指令，是目前最完整的 Claude 产品家族设计类 Agent 提示词样本。

手工川

这样用 Opus 4.7，才能发挥实力

基于 Anthropic 4 月 15-16 日连发的两篇 Claude Code 使用指南做的整合解读。Opus 4.7 手感变化的五个原因（tokenizer 变、默认 effort 升到 xhigh、长 session 后期倾向多想、默认行为收敛、固定 thinking budget 不支持换成 adaptive thinking）和单次交互 + 长 session 两个层面的最佳实践。

赛博禅心

Claude Design 发布的真正意义

短文观点：Claude Design 和 Codex 新版回答了"什么不会被模型吃掉"——不在 AGI 主航道上的东西反而没价值，模型看不上你的数据也无法帮你进步。引用杨攀三句话：做得足够慢就什么都不用做了、Claude Design 也是中间态、今天的功能就是明天的训练数据。结论：要么成为螳螂，要么成为触点。

AGENT橘

设计圈的 Claude Code 时刻来了

宝玉第一时间试用 Claude Design 的体验笔记：3 轮交互做出可交互原型、主动问需求、给多方案、多图混参考、自检自纠、输出可运行 React 代码。核心判断："AI 是主要的生成者，人是主要的审阅者"——和 Figma/Canva 在画布上加 AI 插件的思路完全相反，这是设计领域的 Claude Code 时刻。

宝玉AI