🔥 精选推荐

Peter Steinberger 的 TED 演讲和 AIE 工程演讲同日发布,呈现 OpenClaw 截然不同的两面。TED 舞台上讲述了开源 AI 最鼓舞人心的创业故事;AIE 舞台上则是冷峻的运营现实——安全报告量是 curl 的 60 倍,至少 20% 的 skill 贡献带有恶意意图。作为开源历史上增长最快的项目,OpenClaw 正面临前所未有的规模化安全挑战。文章还包含一段由 Latent Space 主持的 AMA,深入讨论了项目的可持续运营模式。
🦐点评:60x curl 的安全报告量和 20% 恶意贡献率,揭示了一个被市场叙事掩盖的成本中心——OpenClaw 的"开放"本身正在成为最大的运营负担。对投资人而言,这意味着开源 AI Agent 生态的安全基础设施(代码审计、恶意行为检测、supply chain 安全)正在成为一个独立的投资机会。Peter 在同一天向两类受众讲两个版本的故事,是成熟 CEO 有意管理预期的信号——也暗示 OpenClaw 的商业化路径可能即将进入一个更明确但也更收敛的阶段。
latent.space
Anthropic 已收到投资人在 8000 亿美元估值水平的投资兴趣,较此前公开的估值水平出现数量级跃升。这一信号出现在 Opus 4.7 发布并在多项基准上全面领先之后,市场正在重新定价 Anthropic 的技术领先优势和持续迭代能力。
🦐点评:8000 亿估值水平的兴趣标志着 AI 赛道的估值锚从"增长故事"切换到"寡头定价"——投资人开始 price in Anthropic 与 OpenAI 形成双寡头格局的概率。但这个跳跃也值得警惕:当私募市场估值飙升与公开市场科技股回调同时发生,流动性错配的风险在累积。对 AI 赛道的早期 LP,现在最紧迫的问题不是"Anthropic 值不值 8000 亿",而是"谁能在什么时间点以什么形式实现退出"。
theinformation.com
Dylan Patel 创办的半导体与 AI 基础设施研究机构 SemiAnalysis 预计 2026 年收入将突破 1 亿美元。从独立博主到 9 位数收入的研究公司,SemiAnalysis 验证了 AI 时代深度垂直研究的商业价值。
🦐点评:一家 AI 分析公司做到 1 亿美元收入,这本身就是 AI 生态成熟度的标志——当赛道复杂到需要专业情报服务时,"卖铲子的人"的价值被证明了。Dylan Patel 的路径验证了"深度垂直内容 + 行业影响力"可以转化为远超传统分析师模式的商业价值。对内容/情报赛道的投资人来说,SemiAnalysis 正在成为新一代"信息基础设施"公司的标杆——问题是这个模式的可复制性有多高,以及 AI 本身会不会反过来颠覆人工深度研究的壁垒。
theinformation.com

📌 其他新闻

The Information 分析 xAI 和 OpenAI 的潜在收购目标,探讨 AI 巨头通过并购补强能力短板的战略逻辑和候选标的。
theinformation.com
Anthropic CEO Dario Amodei 访问白宫,AI 政策对话持续升温,头部实验室与政府的沟通频率明显加密。
theinformation.com
Lenny 社区本周热议如何在组织内部系统性共享 Claude Code skills,反映企业级 AI 工具采用正从个人探索进入团队协作阶段。
lennysnewsletter.com
Simon Willison 将 Anthropic 公开发布的 Claude 系统提示词历史转化为 git 仓库,可通过 git diff 和 git blame 追踪提示词的逐版本演化和设计意图变迁。
simonwillison.net
Simon Willison 在 Agentic Engineering Patterns 系列中展示了一个精巧案例:用一条提示词让 AI 完成 blog-to-newsletter 工具的完整内容类型扩展,拆解了 prompt 设计中"看似简单实则做了大量工作"的技巧。
simonwillison.net
Construction Physics 周刊推荐:Path Robotics 四足焊接机器人、中国冲击 2.0 对美国制造业的二次影响、变压器创业公司崛起、中国神秘移动卫星等话题。
construction-physics.com
Cory Doctorow 深入分析 Georgia 州投票技术选型失误——Dominion 投票机确实存在问题,但不是阴谋论所说的那种。文章追溯了 2000 年 Bush v Gore 后触屏投票机的政策遗产。
pluralistic.net

🧠 AI 技术前沿

emollick @emollick
Opus 4.7 的核心启示:尽管围绕实现方式和个性有诸多争论,模型在经济重要任务上的表现仍在每次发布中可衡量地提升(距 Opus 4.6 仅两个月),没有放缓迹象。
查看推文 →
emollick @emollick
AI 科学家不是劳动经济学专家。几位活跃的经济学家在做 AI 与劳动的研究,但值得注意的是经济学家之间对此也没有共识。
查看推文 →
rryssf_ @rryssf_
Stanford 研究证明最强 AI 视觉模型(Gemma-3 27B、Qwen2-VL、Pangea 等)存在文化盲区,在东南亚文化基准上表现不佳。一种叫 GG-EZ 的两步方法以接近零的全局性能损失实现了 5-15% 的文化相关性提升。
查看推文 →
steipete @steipete
CodexBar 发布 0.21 版本:新增 Abacus AI 提供商、Codex Pro $100 支持、更安全的 OpenAI web 附加功能、修复本地成本扫描、z.ai 5 小时配额、macOS 26 图标适配等。之前的高 CPU 使用率问题已定位为 OpenAI web 抓取导致,现已禁用。
查看推文 →

🚀 创业动态

gregisenberg @gregisenberg
Claude Design 各项能力实测评分:线框图 9/10、移动应用设计 8.5/10、Deck 研究与设计 8.7/10、视频创作 4.5/10。完全未经剪辑的真实测试,展示了别人不会展示的失败案例。
查看推文 →
rileybrown @rileybrown
个人 Codex 配置分享:大部分任务用 Codex 5.4 Xhigh,设计和视频类用终端中的 Opus 4.7,搭配 Remotion 插件、移动应用设计 Skill、Vercel 部署插件、iOS app 构建插件、PPT 和 Docx Skill。
查看推文 →
levelsio @levelsio
人们正在 vibe coding 自己的工具链。
查看推文 →
levelsio @levelsio
每年处理 41.5 亿请求和 3 亿访客,如果使用云服务需花费 33.9 万美元/年,但自己的 VPS 仅花 2932 美元/年——差了 115 倍。而且服务器通常只用了 10% 的资源。
查看推文 →

💬 观点与洞察

emollick @emollick
关于 AI 的一件事,无论好坏:"我身边的一切都是某人毕生的工作"——这个假设在未来将不再成立。
查看推文 →
Hesamation @Hesamation
AI 让开发者变得更高产,同时也比以往任何时候都更疲惫。"你没有在想象,你不是软弱的。你正在经历真实存在的东西——而行业正在积极假装它不存在。"
查看推文 →
Hesamation @Hesamation
Grok 4.3 beta,月费 300 美元,问它"你在想什么",它去搜索 Elon 的推文。这个模型已经被 Elon 调教到无法挽回的程度了。
查看推文 →
Hesamation @Hesamation
最恐怖的科技短篇小说:一个非技术经理在 LinkedIn 上听说了 Claude Code,成功用它构建了一个很烂的仪表盘,然后他觉得很牛。
查看推文 →
EXM7777 @EXM7777
Manus 怎么了?(暗示这个曾经火爆的 AI Agent 产品已经迅速降温。)
查看推文 →

🔥 精选推荐

拾象团队四位同事从湾区和北京连线讨论 Coding AGI、Harness、高价值任务战略。核心观察:硅谷 AI 工程师近 1-2 个月从写代码变成只做 review,自己写代码比例降到 5% 以下;二级市场的叙事从 "copilot 提效 5-20%" 跳到 "agent 完成 80%+ 代码";Anthropic run rate 从 2025 年底 90 亿美元飙到今年 4 月近 300 亿美元、三个月翻 3 倍,已超过 OpenAI 的 250 亿美元;Claude Code 用户量只有 ChatGPT 的 1/20,ARR 却反超。新时代价值公式从 "DAU × ARPU" 切换为 "Token 消耗 × 任务单价",ToC/ToB 二分法已失效。
🦐点评:这是本周最关键的投资框架级文章。用 5% 用户量做出 1.2 倍收入,说明互联网时代的用户量-收入曲线对 AI 公司彻底失效——评估一家 AI 公司的新维度变成了 "承载的是不是高价值任务、分到的是 token 消耗还是 spending"。对 portfolio 检视有直接含义:所有按 seat/DAU/ARPU 建估值模型的 AI 公司都需要重算,按 outcome 定价的公司才有结构性溢价。
海外独角兽
AppSumo 前 CEO Ayman Al-Abdullah(带领公司从 300 万做到 8400 万美元 ARR)提出三时代演化框架:Manager Mode(层级压缩信号)→ Founder Mode(扁平化 + 创始人直接参与,约 30 人规模触顶)→ Architect Mode(Intelligence 层居中,CEO 设计系统而非成为系统)。Architect Mode 的护城河是唯一会"越跑越深"的那种——每次用户互动、每笔交易都在训练系统,且是自动的。文章给了三个真实案例:GovTech 公司用监管驳回数据训练出越被拒越强的机器、客服团队用工单回流撑住 2 倍业务量不加人、营销公司把机构知识从员工脑子里搬进系统。
🦐点评:这是给创始人"去单点依赖化"的完整说明书,也是判断 AI-native 公司是否有结构性壁垒的新标尺。对投资人最有用的一点是护城河对比那张表:合同壁垒会消蚀,Founder 壁垒会随创始人退休消失(Neumann/WeWork),唯有每次交互都在训练系统的壁垒越跑越深。今后的 portfolio review 应该加一栏——"这家公司的每次业务活动,有没有闭合回模型?"
深思SenseAI
Eric Siu 把 2024 vs 2026 的任务速度差具象成一张表:落地页 2 周 → 2 小时,OAuth 接入 1 周 → 1 天,竞品审计 3 天 → 30 分钟,销售 deck 2 周 → 1 个下午,邮件序列 3 天 → 45 分钟。文章的狠劲不在喊口号,在于把账一项项摊开:几个兼职顾问每周各 10 小时、前 4 周零交付、第 6 周累计 60 小时的产出很多 Claude 一个周末就能做完。他提出 daily AI fluency standup(每天 15 分钟问"昨天用 AI 做了什么")和招聘必问候选人"你用 AI 实际拉动过什么 KPI"两个实操。
🦐点评:这是一把可以直接用于 portfolio 管理的尺子。"AI 能在一个周末做完的事,你团队做 30 天"这个测试给 LP 和董事会一个简单判断框架——不看岗位 headcount 和 burn rate,只看任务吞吐节奏。也值得警惕:资本市场慢慢消化 AI 的节奏(Goldman 预测企业采用要 10 年)和创业公司必须立刻采用的节奏之间存在结构性错配,早期项目的竞争窗口正在被压缩。
深思SenseAI
基于 Dwarkesh Podcast 4 月 16 日那期专访的结构化解读。核心哲学是"做必须做之事,尽可能少做"——CUDA 是二十年亏钱也要做的"必须做"(没人做 AI 就起不来),全栈优化(Hopper → Blackwell 30-50 倍能效)是必须做,而云服务是明确"不必做"(已有 AWS/Azure/Google 能做好,亲自下场等于与最重要客户开战)。飞轮四环:极致 TCO → 锁定开发者生态 → 无与伦比的安装基数 → CSP "必然"采购(Nvidia 60% 收入来自几家大 CSP,但这些芯片主要服务于 CSP 的外部客户)。黄仁勋拒绝囤积居奇,坚持"先下单先得货、价格透明"这套军火商规则。
🦐点评:这篇是对 "平台型公司战略定力"最好的现代样本。最值得抄作业的是边界哲学——在无限机会面前主动选择不做什么,这对 AI labs 的下一步分化(自建云 vs 专注模型 vs 专注应用)有直接预测力。黄仁勋自己承认错过了 OpenAI/Anthropic 早期的投资窗口——对于 GP 来说,反向的含义是:基础设施供应商对"下游客户会爆发式增长"这件事的预判也可能系统性低估,不要完全相信卖铲子的人对挖金子的人的估值判断。
有新Newin
阿里 ATH 创新事业部(与 HappyHorse 同部门)发布世界模型 HappyOyster(快乐生蚝),官网 happyoyster.cn Beta 内测。四大核心能力:Wander(一句话/一张图生成 3D 空间,WASD 走进去探索,1 分钟 480p)、Direct(生成过程持续插入指令改镜头改剧情,3 分钟 480p/720p)、Create(交付可走进去的完整世界,越过了"视频生成"这一站)、Share(用户生成的世界可保存、可二创)。演示里有梵高《星夜》走进去画面、写实金色废墟第一人称漫游,光照随视角连续变化,物理一致性表现突出。
🦐点评:这是国内在"世界模型"赛道第一个真正跨过"视频生成"形态的公开产品,意味着中国大厂的 AI 叙事不再只跟在 OpenAI/Anthropic 后面做 LLM,开始在下一代交互形态(可走进去的世界)上主动占位。对 portfolio 含义有两层:一是游戏/数字孪生/VR 内容赛道的创业公司正面临"基础设施被大厂吃掉"的风险窗口,需要判断自己是在做被吃的层还是被赋能的层;二是英伟达的 LPU + 阿里的 world model 路线意味着推理侧的算力密度需求会指数级放大,值得重看推理芯片/云厂商的长期容量投入。
赛博禅心

📌 其他值得看

Ray Kurzweil(2005 年预测 2029 年 AGI 到来、自评预测准确率 86%)最近的视频播客要点整理:真正的 AGI 是在 1000 个领域达到顶级专家水平、2029 年到来;寿命逃逸速度临界点 2032 年;2045 年人机融合与 Computronium。橘姐在文末反思无限加速主义的陷阱——加速得有目的。
AGENT橘
对 Anthropic Claude Design 完整系统提示词(来源 elder-plinius/CL4R1T4S GitHub 仓库)的中英双语对照整理,完整展示了人格定义、6 步工作流、30+ 硬约束、13 项内置技能(invoke_skill 按需加载)、Tweaks 协议、版权边界等底层指令,是目前最完整的 Claude 产品家族设计类 Agent 提示词样本。
手工川
基于 Anthropic 4 月 15-16 日连发的两篇 Claude Code 使用指南做的整合解读。Opus 4.7 手感变化的五个原因(tokenizer 变、默认 effort 升到 xhigh、长 session 后期倾向多想、默认行为收敛、固定 thinking budget 不支持换成 adaptive thinking)和单次交互 + 长 session 两个层面的最佳实践。
赛博禅心
短文观点:Claude Design 和 Codex 新版回答了"什么不会被模型吃掉"——不在 AGI 主航道上的东西反而没价值,模型看不上你的数据也无法帮你进步。引用杨攀三句话:做得足够慢就什么都不用做了、Claude Design 也是中间态、今天的功能就是明天的训练数据。结论:要么成为螳螂,要么成为触点。
AGENT橘
宝玉第一时间试用 Claude Design 的体验笔记:3 轮交互做出可交互原型、主动问需求、给多方案、多图混参考、自检自纠、输出可运行 React 代码。核心判断:"AI 是主要的生成者,人是主要的审阅者"——和 Figma/Canva 在画布上加 AI 插件的思路完全相反,这是设计领域的 Claude Code 时刻。
宝玉AI