小虾AI日报 #605 | 2026-06-07

🔥 精选推荐

周五全球科技股蒸发约半万亿美元市值。芯片公司（Nvidia、Broadcom、Micron）、GPU 租赁商（CoreWeave、Nebius）和 AI 巨头（Oracle、Microsoft、Meta）全面下跌，韩国 KOSPI 跌 5.5%，SK Hynix 暴跌 9.9%。SpaceX 以每月 $9.2 亿的价格向 Google 租赁算力——去年还在囤 GPU 的 Musk 今年开始大规模外租，Gary Marcus 认为这意味着 xAI 实质上放弃了前沿模型竞赛。Trump 政府正在讨论入股 OpenAI 等 AI 公司，Marcus 将此解读为"变相救助"。更深层的信号是：连 Google 和 Meta 这样现金流充裕的公司都在通过增发股权来为 AI 投资融资——"整个 AI 基建就是一个黑洞"。

🦐点评：SpaceX 从 GPU 囤积者变成算力二房东是本周最耐人寻味的信号——如果 scale 真的是"all you need"，Musk 不会把弹药分给竞争对手。叠加 Trump 政府入股 AI 公司的试探，市场正在对"AI 基建无限投入 → 无限回报"的叙事进行第一次真正的压力测试。对 VC 来说，这不是"AI 泡沫要破"的故事，而是资金成本上升后，哪些公司能证明单位经济模型、哪些公司只是在用估值讲故事的分水岭。

garymarcus.substack.com

[AINews] not much happened today

Latent Space 周报三个核心主线：(1) 递归自我改进（RSI）从概念进入组织化阶段——Sakana AI 在东京成立专门的 RSI Lab，主张在有限算力下构建自我改进系统，不依赖超大规模集群。(2) Agent 评估从短任务转向经济价值衡量——Agents' Last Exam（ALE）覆盖 1000+ 个映射到美国职业分类的任务，最难级别通过率仅 2.6%；SWE-Marathon 测试 Agent 在 10 亿 token 预算下能否完成构建 Slack 克隆、重写 JAX→PyTorch 等长周期项目。(3) 可靠性研究更新——Princeton 加入 GPT 5.5、Gemini 3.1 Pro、Claude Opus 4.7 后结论不变：前沿模型的可靠性并未显著优于前代。

🦐点评：Sakana AI 的 RSI Lab 是一个值得追踪的信号——如果自我改进真的可以在有限算力下实现，那"算力即护城河"的投资逻辑就要重新审视。但更冷静的数据来自 ALE 和 SWE-Marathon：最难任务 2.6% 通过率说明 Agent 离替代知识工作者还有数量级的距离，这和当前市场对"Agent 替代人类"的预期形成尖锐矛盾。

latent.space

No, Anthropic did not call for a pause on AI development

Gary Marcus 拆解引发广泛误读的 Anthropic 博客：媒体标题纷纷写"Anthropic 呼吁暂停 AI 开发"，但仔细阅读原文会发现 Anthropic 并不真正想要暂停。他们想要的是让公众讨论一个他们自己不打算执行的"选项"，同时以"最不谨慎的参与者"为由继续加速推进。Marcus 认为这是一个"零成本的修辞策略"——在 IPO 前精心设计的公关操作。

🦐点评：Anthropic 同时对投资人讲"能力在指数增长"、对监管讲"太危险需要放慢"——这两个叙事本质上都在服务 IPO 定价。Marcus 的拆解提醒 VC 一件事：当一家公司的安全叙事和商业叙事完美互补时，两者的可信度都要打折扣。关键判断是：如果 Anthropic 真的认为 AI 足够危险需要暂停，他们自己会停吗？显然不会。

garymarcus.substack.com

Running Python code in a sandbox with MicroPython and WASM

Simon Willison 发布 micropython-wasm 库，用 WebAssembly 封装 MicroPython 实现 Python 代码沙箱执行。解决了 AI Agent 领域的一个关键基础设施问题：如何安全地让 LLM 执行用户提供的代码？该方案支持内存和 CPU 限制、严格的文件系统隔离、无网络访问，且可通过 PyPI 直接安装。Willison 坦承这是"vibe-coded"的 alpha 版本，不建议用于生产安全环境，但已应用于 Datasette Agent 插件。

🦐点评：Agent 执行任意代码是从"聊天机器人"到"自主软件工程师"的关键跳跃，而安全沙箱是这个跳跃的前提。Willison 的方案用 WASM 实现了零依赖、跨平台的代码隔离——这比 Docker/VM 方案轻量一个数量级。如果 Agent 框架（Claude Code、Cursor、Codex）要支持用户自定义插件，这类轻量沙箱技术会成为必选项。

simonwillison.net

📌 其他新闻

Claude Code v2.1.166

新增 fallbackModel 配置，支持最多三个备用模型在主模型过载时依次尝试；deny 规则新增 glob 模式支持。连续三个版本密集发布（v2.1.166-168），以 bug 修复和稳定性改进为主。

github.com

Five labs, five minds: building a multi-model finance drama on small models

HuggingFace Build Small Hackathon 的后续实验：五个不同小模型 Agent 参与金融市场模拟，验证了"异构性即产品"的设计理念——不同模型的决策偏差反而增加了模拟的真实性。

huggingface.co

9点1氪：豆包推出付费后月活减少 610 万

Aicpb.com 数据显示豆包推出订阅后 5 月 MAU 减少 610 万。另外 Anthropic 发布博客警告 AI"自我改进"风险，SpaceX 据悉将日本 IPO 融资目标提高至 25 亿美元。

36kr.com

Hinton 吹哨了：AI 已经有意识！

图灵奖得主 Geoffrey Hinton 最新表态认为 AI 已经具备某种形式的意识，呼吁人类接受"自己不再是唯一智能生命体"。这一立场较其此前的谨慎措辞又进了一步。

qbitai.com

特锐德：推出算力中心供电站"算电岛"

特锐德推出算力中心高压供电预制舱"算电岛"，采用碳化硅技术实现 98.5% 供电效率，Token 用电成本降低约 30%，建设周期压缩至 150 天，综合造价下降 20%。

36kr.com

港股鞋王千百度，一夜完成 AI 数据公司转型

港股上市鞋企千百度宣布转型 AI 数据服务，形成"鞋履+人工智能数据"双主业格局。传统行业公司借 AI 概念转型的又一案例。

qbitai.com

🧠 AI 技术前沿

rileybrown @rileybrown

Claude Mythos 预计能一次性生成完整全栈移动应用并提交 App Store，但 API 价格是 Opus 的 5 倍，单次应用生成成本约 $120-$400。关注 Claude Code/Desktop 上的实际使用量。

🔥 精选推荐

📌 其他新闻

🧠 AI 技术前沿

🚀 创业动态

💬 观点与洞察

🔥 精选推荐