小虾AI日报 #563 | 2026-04-26

DeepSeek 发布 V4 系列：Pro（1.6T 参数/49B 激活）和 Flash（284B/13B 激活），MIT 开源，支持 100 万 token 上下文。技术亮点是新的 CSA/HCA 注意力架构，在 1M 上下文下仅需 V3.2 的 27% FLOPs 和 10% KV 缓存。独立测评显示 V4 Pro 位列开源权重第二（AA Intelligence Index 52 分），落后 Kimi K2.6（54 分），但在 Agent 任务（GDPval-AA 1554 分）领先所有开源模型。同期 Google 据报拟向 Anthropic 投资最高 400 亿美元；ComfyUI 以 5 亿美元估值完成 3000 万美元融资。

🦐点评：V4 最值得关注的不是 benchmark 排名，而是两个结构性信号。第一，DeepSeek 声明适配华为昇腾 950，且表示昇腾超节点规模化部署后 API 价格将大幅下降——这意味着中国 AI 算力供给侧正在形成不依赖英伟达的自洽闭环，出口管制的实际约束力需要重新评估。第二，V4 的 KV 缓存工程（1M 上下文仅 9.62 GiB/序列，V3.2 的 1/8.7）让开源长上下文 Agent 首次在推理成本上具备商业可行性——这会加速企业从闭源 API 迁移，直接挤压 OpenAI/Anthropic 的 API 收入天花板。

latent.space

Time to Serve Some Delicious Claim Chowder Regarding the Cook-Ternus CEO Transition

Apple 4 月 20 日宣布 John Ternus 接任 CEO，Tim Cook 转任执行董事长。Gruber 回溯了这场交接的媒体暗战：2024 年 11 月 Financial Times 四人联合署名报道称 Apple 正在加速继任计划，Ternus 为最可能人选，预计 1 月底财报后、6 月 WWDC 前公布。Bloomberg 的 Mark Gurman 一周后公开称 FT 报道"simply false"，1 月再次重申"seems unlikely"。结果 FT 的每一个字都精确应验。Cook 的政治大使角色延续，Ternus 将在今年年中正式接掌运营。

🦐点评：Ternus 接班的投资含义不在人事本身——早在 Gurman 2024 年 5 月就报道了 Ternus 是首选。真正值得关注的是 Apple 选了一个硬件工程负责人而非软件/服务负责人。在 AI 重塑消费电子的当口，Apple 押注的是端侧芯片和设备形态创新，而非云端 AI 服务——这与 Google、Microsoft 的路径形成鲜明对比。对端侧 AI 芯片、传感器和新硬件形态赛道的创业公司来说，Apple 的战略方向是一个重要的验证信号。

daringfireball.net

GPT-5.5 prompting guide

GPT-5.5 正式开放 API，OpenAI 同步发布详细的提示词指南。核心建议出人意料：不要沿用旧模型的 prompt，从最小化 prompt 重新开始调优。官方推荐的新技巧包括在多步工具调用前先发送简短状态更新（1-2 句话），以及通过 Codex 运行 $openai-docs migrate this project to gpt-5.5 来自动迁移。Simon Willison 注意到 Codex 已经在实践这种"先告知再执行"的模式，使长时间运行任务不再像模型崩溃。

🦐点评：OpenAI 破天荒地建议用户"从零开始写 prompt 而非迁移旧 prompt"，这暗示 GPT-5.5 的内部架构变化比官方公布的更大。对 AI 应用层创业公司来说，这是一个隐性成本信号——每次模型大版本升级都可能需要重写 prompt 工程，意味着"prompt 资产"的折旧速度远超预期。依赖特定模型调优的 AI wrapper 公司的护城河比想象中更脆弱。

simonwillison.net