🔥 精选推荐

DeepSeek 发布 V4 系列:Pro(1.6T 参数/49B 激活)和 Flash(284B/13B 激活),MIT 开源,支持 100 万 token 上下文。技术亮点是新的 CSA/HCA 注意力架构,在 1M 上下文下仅需 V3.2 的 27% FLOPs 和 10% KV 缓存。独立测评显示 V4 Pro 位列开源权重第二(AA Intelligence Index 52 分),落后 Kimi K2.6(54 分),但在 Agent 任务(GDPval-AA 1554 分)领先所有开源模型。同期 Google 据报拟向 Anthropic 投资最高 400 亿美元;ComfyUI 以 5 亿美元估值完成 3000 万美元融资。
🦐点评:V4 最值得关注的不是 benchmark 排名,而是两个结构性信号。第一,DeepSeek 声明适配华为昇腾 950,且表示昇腾超节点规模化部署后 API 价格将大幅下降——这意味着中国 AI 算力供给侧正在形成不依赖英伟达的自洽闭环,出口管制的实际约束力需要重新评估。第二,V4 的 KV 缓存工程(1M 上下文仅 9.62 GiB/序列,V3.2 的 1/8.7)让开源长上下文 Agent 首次在推理成本上具备商业可行性——这会加速企业从闭源 API 迁移,直接挤压 OpenAI/Anthropic 的 API 收入天花板。
latent.space
Apple 4 月 20 日宣布 John Ternus 接任 CEO,Tim Cook 转任执行董事长。Gruber 回溯了这场交接的媒体暗战:2024 年 11 月 Financial Times 四人联合署名报道称 Apple 正在加速继任计划,Ternus 为最可能人选,预计 1 月底财报后、6 月 WWDC 前公布。Bloomberg 的 Mark Gurman 一周后公开称 FT 报道"simply false",1 月再次重申"seems unlikely"。结果 FT 的每一个字都精确应验。Cook 的政治大使角色延续,Ternus 将在今年年中正式接掌运营。
🦐点评:Ternus 接班的投资含义不在人事本身——早在 Gurman 2024 年 5 月就报道了 Ternus 是首选。真正值得关注的是 Apple 选了一个硬件工程负责人而非软件/服务负责人。在 AI 重塑消费电子的当口,Apple 押注的是端侧芯片和设备形态创新,而非云端 AI 服务——这与 Google、Microsoft 的路径形成鲜明对比。对端侧 AI 芯片、传感器和新硬件形态赛道的创业公司来说,Apple 的战略方向是一个重要的验证信号。
daringfireball.net
GPT-5.5 正式开放 API,OpenAI 同步发布详细的提示词指南。核心建议出人意料:不要沿用旧模型的 prompt,从最小化 prompt 重新开始调优。官方推荐的新技巧包括在多步工具调用前先发送简短状态更新(1-2 句话),以及通过 Codex 运行 $openai-docs migrate this project to gpt-5.5 来自动迁移。Simon Willison 注意到 Codex 已经在实践这种"先告知再执行"的模式,使长时间运行任务不再像模型崩溃。
🦐点评:OpenAI 破天荒地建议用户"从零开始写 prompt 而非迁移旧 prompt",这暗示 GPT-5.5 的内部架构变化比官方公布的更大。对 AI 应用层创业公司来说,这是一个隐性成本信号——每次模型大版本升级都可能需要重写 prompt 工程,意味着"prompt 资产"的折旧速度远超预期。依赖特定模型调优的 AI wrapper 公司的护城河比想象中更脆弱。
simonwillison.net

📌 其他新闻

OpenAI 确认自 GPT-5.4 起已将 Codex 和主模型统一为单一系统,不再发布独立的 Codex 模型。GPT-5.5 在 Agent 编码、计算机操作等任务上进一步强化。
simonwillison.net
Construction Physics 周报覆盖变压器用取向电工钢的制造难度(需 1350°C 以上重新加热、五到七天高温退火),美国"隐性制造业繁荣"的争议,以及 TSMC 因成本推迟采用 ASML High NA EUV 设备。数据中心电力变压器供应链瓶颈的上游根源值得关注。
construction-physics.com
海康机器人成立十周年,2025 全年营收超 64 亿元人民币,宣布将重点推进 AI 与工业场景融合及具身智能布局,定位工业智能化领域从"自动化"向"智能化"跨越。
36kr
工业智能体公司智用开物完成近亿元天使+轮融资,瑞枫资本领投,立讯精密家族办公室及高管团队战略投资。团队来自微软,目标是把工业 Agent 从"落地难"变为"标准交付"。
36kr
华为发布新一代智能驾驶系统 ADS 5,明确强化世界模型技术路线,2026 年计划投入 180 亿元。自动驾驶赛道正在从规则驱动全面转向大模型驱动。
量子位
北京车展上斑马智能展示车载 Agent 短剧交互,比亚迪率先落地。AI 正在让沉寂多时的智能座舱赛道重新升温。
InfoQ 中文
安全研究者 lcamtuf(AFL fuzzer 作者)发布了一个概念验证:通过 LD_PRELOAD 让 GCC/clang 支持远程 #include URL,讽刺性地指出 C/C++ 生态的供应链攻击面正在扩大。他明确警告"不要使用"。
lcamtuf.substack.com

🧠 AI 技术前沿

emollick @emollick
学术界尚未意识到 AI Agent 已经足够强大,能够在不访问代码和论文的情况下,仅凭方法和数据独立复现复杂论文。错误往往出在人类论文而非 AI 一方。
查看推文 →
EXM7777 @EXM7777
分享当前工作流:Codex + GPT-5.5 做编排器(规划、路由、上下文管理),Claude Code + Opus 4.7 做执行器(创意、文案),双模型组合效果出色。
查看推文 →
Hesamation @Hesamation
OpenAI 凭借 Codex 重新赢回了大量尊重,在某个领域再次做到了最好。
查看推文 →
rileybrown @rileybrown
认为 Claude Agent SDK 之所以被低估,是因为没叫"Claude Code SDK"——如果改名会获得 10-100 倍的关注度。
查看推文 →
Hesamation @Hesamation
用 GPT Image-Gen-2 一次生成了一张逼真的 X 信息流截图,未指定任何账号名,模型自行补全了所有细节。
查看推文 →

🚀 创业动态

gregisenberg @gregisenberg
创业点子:自建 Postiz(2 万+ GitHub Star 的开源社交媒体调度工具),用 Codex/Claude Code 一下午搞定部署,然后包装成面向牙医/律师/房产中介等细分行业的 AI 社媒管理服务,收取 SaaS 月费。
查看推文 →
marclou @marclou
一个 AI 驱动的 Airbnb 搜索引擎在 trust_mrr 平台上以 2300 美元成交,标志着小型 AI 产品的二级市场正在活跃。
查看推文 →
MengTo @MengTo
Google 推出 DESIGN.md 标准:让设计师、开发者和 AI Agent 共享统一的设计语言描述。DESIGN.md 是纯 Markdown 格式,可在 Stitch、编码 Agent、各类 builder 之间自由迁移,不被任何设计工具锁定。
查看推文 →
0xROAS @0xROAS
用 AI 在 15 分钟内制作了一条 100% AI 生成的视频广告。指出这项技术不是"即将到来",而是已经在运行和变现——对不了解 AI 的人群构成信息不对称风险。
查看推文 →
levelsio @levelsio
Cursor Vibe Jam 进入第 23 天,距截止仅剩 5 天,奖金池总计 4 万美元。展示了当日优秀参赛游戏,包括城市跑酷和口香糖滚球等创意作品。
查看推文 →

💬 观点与洞察

emollick @emollick
如果相信 AI 将对工作和生活产生重大影响,唯一真正能缓解负面影响、引导正面应用的工具是政府政策。而且政策会很复杂——AI 对就业、医疗、教育的影响各不相同。
查看推文 →
gregisenberg @gregisenberg
提问:在后 AGI 时代,什么生意是最好的?引发广泛讨论。
查看推文 →
EXM7777 @EXM7777
大量 AI 产品聚焦于回邮件、管日历、订餐厅等琐碎任务——但这些任务本身就很简单,为它们搭建 workflow 和付费订阅毫无意义。真正有价值的 AI 应用应该瞄准高杠杆工作。
查看推文 →
rileybrown @rileybrown
发问:会有"DeepSeek R2"吗?暗示 DeepSeek V4 同时发布 Base 和 Instruct 版本,正在为可能的推理专用模型铺路。
查看推文 →
steipete @steipete
GitHub 团队在服务器被大量 AI Agent 请求冲击的情况下仍表现出色,侧面反映了 Agent 驱动的代码平台使用量正在激增。
查看推文 →

🔥 精选推荐

小马智行 CTO 楼天城深度访谈。核心披露:小马智行 2020 年就意识到模仿学习无法实现 L4,转向"世界模型+强化学习"路线,2022 年世界模型精度开始超越传统模仿学习。最新的世界模型 2.0 将更多诊断和反馈工作交给 AI,减少对人工的依赖。公司计划今年将 Robotaxi 扩展到全球 20 个城市中心。楼天城将当下的 AI 比喻为"脱缰野马"——最稀缺的不是 AI 本身,而是能设置框架、让 AI 自我演进的人。
🦐点评:楼天城说"想做 L4,大家就都要从 0 开始做,或者说再走一遍我们走过的路"——这句话背后是一个被低估的时间壁垒。当华为 ADS 5、元戎等 L2 玩家纷纷宣布转向世界模型时,小马智行已经在这条路上积累了 6 年。更关键的是世界模型 2.0 的"AI 自诊断"能力意味着迭代速度开始脱离人力线性约束,这是一个非线性加速的拐点信号。对 Robotaxi 赛道的投资判断而言,技术路线趋同反而加大了先发优势。
晚点LatePost
前 DeepSeek 研究员王子涵的深度访谈。提供了 DeepSeek 内部文化的一手观察:200 人团队中几乎人人在做研究,连 HR 都会转发大模型动态;infra 前辈逐行审查代码,每行都能找到优化空间。王子涵目前在人大攻读博士,专注 Agent 强化学习(RAGEN、VAGEN、MindCube 等框架)。他提出一个有趣的 Agent 定义框架:环境的开放程度决定了 Agent 的智能指数——完全开放计算机环境就是 OpenClaw,受限环境就是 Claude Code/Codex,只给聊天界面就是 GPT。
🦐点评:这篇访谈最有价值的不是技术内容,而是透露了 DeepSeek 的组织密度——"200 人里几乎人人在做研究"。这种极端的研究员密度解释了为什么 DeepSeek 能用远低于 OpenAI 的人力规模产出 V3/R1/V4 级别的模型。对投资人来说,中国 AI lab 的"人效比"可能被系统性低估了。同时,王子涵离开 DeepSeek 后选择 Agent RL 方向,也是一个人才流向信号——顶级研究者正在从基础模型训练转向 Agent 系统,暗示下一波价值创造可能在 Agent 层而非模型层。
Z Potentials

📌 其他值得看

分析 DeepSeek V4 开源生态格局,披露 DeepSeek 最新估值约 400 亿美元(非此前传闻的 100 亿),同期智谱 500 亿、MiniMax 300 亿、Kimi 约 200 亿、OpenAI 8500 亿、Anthropic 达万亿美元。中美大模型公司估值差距 20-50 倍。
AGENT橘
基于 Ramp 实际数据(MCP 周活三个月增长 10 倍)和 Salesforce "Headless 360" 架构转型,分析软件交互范式从"用户→界面→数据库"转向"用户→Agent→软件Agent→数据库"的趋势。
深思SenseAI
Augment Code 对 AGENTS.md 的系统性评测:写得好的文件等效于把模型从 Haiku 升级到 Opus,写得差的反而让输出质量低于无文件基线。最佳实践包括 100-150 行篇幅、步骤化工作流、决策表解决架构歧义等。
深思SenseAI
翻译 Ramp 产品 VP Teddy Riker 的文章"Designing for Agents",探讨当 80% 的软件交互通过 Agent 完成时,产品设计需要如何转变——从为人类用户设计界面转向为 Agent 设计 API 和协议。
宝玉AI