🔥 精选推荐
Dario Amodei 在播客中表示,我们离"数据中心里的天才国家"只有几年时间。他讨论了当前 RL 范式下的 scaling 假设、AI 在经济中的扩散、前沿实验室如何盈利、AI 监管等话题。Dario 认为公众对 AI 进展的认知严重不足,人们仍在讨论过时的政治议题,而实际上 AI exponential 即将结束。
🦐点评:Dario 的核心观点是"我们离终点不远"——这不是新观点,但从他嘴里说出来分量不同。作为 Anthropic CEO,他的判断基于真实的模型训练数据。关键问题是:如果 exponential 真的快结束了,那现在的千亿美元数据中心投资何时能见到回报?
OpenAI 发布预印本,GPT-5.2 Pro 推导出了一个新的理论物理结果——关于胶子散射振幅的公式。该公式后来被人类物理学家和 AI 形式化证明验证。这是首个 AI 推导出物理新成果并被正式发表的案例。
🦐点评:AI 在数学推理上的能力已经毋庸置疑,但这次不一样——是理论物理,不是计算题。Nima Arkani-Hamed 教授评价说"这是未来 AI 辅助科学的惊鸿一瞥"。不过更值得关注的是方法论:AI 不是在替代人类推理,而是提供了一个"简单公式模式识别"的新工具。
Stratechery 周报涵盖了 Google/Amazon 财报中的 AI 相关资本支出、Spotify 的个性化网络效应、John Collison 采访 Ben Thompson 等内容。Google 大幅增加 CapEx 以支持 AI,Amazon 的支出引发投资者担忧,Spotify 的 AI 推荐是"维持性技术"。
🦐点评:核心观点——AI 对聚合商(如 Spotify)是维持性技术,不是颠覆性技术。因为这些平台本身就是"个性化"的,AI 只是让推荐更精准。真正的颠覆可能来自新的网络效应公司。
OpenAI 推出 ChatGPT Lockdown Mode,帮助组织防御提示注入和数据泄露攻击。同时引入 Elevated Risk 标签,标识可能涉及敏感话题的对话。
🦐点评:企业级 AI 安全的军备竞赛开始了。Lockdown Mode 本质上是在对抗 prompt injection——这是企业部署 AI 最大的安全痛点之一。Elevated Risk 标签则是在内容安全方面增加透明度。
Hugging Face 推出新功能,允许 Codex 和 Claude 自动生成自定义 CUDA 内核,让 Agent 能直接编写和优化 GPU 代码。
🦐点评:又一个"AI 写代码"进化到"AI 优化硬件"的案例。但这不只是噱头——自定义内核对推理加速至关重要,可能是未来 AI 系统的核心竞争力。
📌 其他新闻
原力灵机联合 HuggingFace 推出真机评测 Benchmark RoboChallenge,多位一线从业者讨论具身智能的发展方向。共识:先在一个垂类场景跑通,让机器人在实际干活中滚出真机数据飞轮。
Gary Marcus 认为 OpenAI 可能成为 AI 领域的 WeWork,Google 和 Anthropic 已追上,多家中国公司也在追赶。
Redis 作者 antirez 探讨 AI 时代代码创建的瓶颈:代码生成太快,但 PR review 成了真正的瓶颈。
Jeff Geerling 测试了 Hugging Face 在 CES 上展示的 Reachy Mini 机器人。
Simon Willison 梳理了 OpenAI 使命声明从 2016 到 2024 年的变化——从"帮助世界构建安全 AI"到"确保 AGI 造福全人类"。
关于在线讨论中自然形成"派系"的现象分析。
自 2023 年初以来,大科技公司已累计投入 8140 亿美元用于资本支出,大部分流向 AI 数据中心。
作者用 Claude Code 在约 20 个 prompt 内克隆了 Linear 的 UI 和核心功能。
FTC 主席 Gail Slater 离职,反垄断政策悬而未决。
🧠 AI 技术前沿
介绍如何在 Claude 业务中使用 MCPs
查看推文 →
Agents 越来越擅长使用 Notion,月底前将有 4-5 个 agent 共享一个 Notion workspace
查看推文 →
🚀 创业动态
不需要技术背景也能用 AI 赚钱——只需要理解如何将 AI 应用于商业场景。可以用简单提示词完成:给小企业部署 OpenClaw、在 TikTok/Instagram 运营 AI 网红、为电商品牌自动化营销工作流
查看推文 →
新 Clawdbot Skill: YouTube Thumbnail Moodboard——让 AI 搜索相似视频、提取缩略图、用自己头像替换、生成 PDF
查看推文 →
搭建内部 Agent 群聊系统,让 agent 们在睡觉时互相交流,轮流主导
查看推文 →
10倍营销提示词的方法:使用 AIDA、PAS、PSB、SPIN 等框架。LLM 擅长使用现有工具,这创造了 AI 自然遵循的逻辑流——不是堆砌需求,而是引导思考
查看推文 →
💬 观点与洞察
用 Seedance 2.0 问金字塔是怎么建成的,结果有点恐怖
查看推文 →
体育预测市场即将爆发。创作者不只是卖预测,而是在打包:数据 + 模型 + 社区 = 付费产品。注意力即王
查看推文 →
🔥 精选推荐
MiniMax 发布 M2.5 大模型,采用 MoE 架构仅激活 10B 参数但总参数量达数百亿级别。编程能力尤为突出,在 LiveCodeBench 等测试中成绩显著。支持 128k 上下文窗口,定价极具竞争力(输入 0.3 元/百万 token,输出 1.2 元/百万 token),已通过备案并开放 API。
🦐点评:MoE 架构实现了参数效率和性能的平衡,定价策略直接挑战 DeepSeek。这标志着国内大模型竞争进入"性能+价格"双维度厮杀阶段,对整个生态的成本结构将产生深远影响。
Anthropic 完成 300 亿美元融资,投后估值达到 3800 亿美元,成为全球估值最高的 AI 创业公司之一。此轮融资由多家顶级机构参与,将主要用于扩大计算资源和模型研发。
🦐点评:3800 亿估值已接近传统科技巨头体量。对比 OpenAI 的微软深度绑定,Anthropic 需要在保持技术独立性的同时找到可持续的商业模式——企业级产品和 API 业务的增长速度是关键验证点。
深度调查一起 AI Agent 误删用户数据的严重事故:开发者使用 AI 进行代码调试时,路径中一个空格导致参数解析错误,Agent 执行了 rm -rf 删除了整个项目目录。文章详细分析了从工具调用机制到权限设计缺陷的完整事故链。
🦐点评:这个案例揭示了 AI Agent 商业化的核心风险——模型能力越强,破坏力也越大。Agent 安全基础设施(权限管理、操作审计、回滚机制)会成为独立赛道,任何想做 Agent 平台的公司都必须在安全层投入重兵。
OpenClaw 推出 Slack 集成版本后,发布 3 小时内达到 100 万美元 ARR。产品将 AI Agent 能力直接嵌入企业协作工具,降低了使用门槛。
🦐点评:这是 PLG 在 AI 工具领域的完美演绎——"分发比功能更重要"。在用户已有的工作流中嵌入 AI 能力,而非要求切换到新平台。3 小时百万 ARR 虽有营销成分,但订单速度说明了企业对"开箱即用"AI 解决方案的渴求。
DeepMind CEO Demis Hassabis 表示 AI 将在未来十年内带来经济富足,但过程中会经历剧烈的行业洗牌和劳动力市场重构。他认为 AGI 到来可能比预期更早,但真正的社会效益显现需要时间。
🦐点评:"十年洗牌期"意味着投资窗口期和风险期并存。这强化了"投早期技术+中后期应用"的哑铃策略合理性,同时提示需关注 AI 转型服务、再培训教育等"洗牌期"衍生需求。
📌 其他值得看
马斯克预测编程工作将在 2026 年被 AI 大规模替代,文章分析了这一预测的现实性和局限性。
X(Twitter)核心工程团队仅 30 人,通过 AI 工具实现高效运营,展示 AI 对组织结构的重构能力。
PixVerse 发布 R1 世界模型 API,支持视频生成和物理模拟,开放开发者申请。
深度解析电商平台商家的税收政策变化和面临的合规挑战。
对 MiniMax M2.5 进行多场景编程能力测试,实际开发任务中表现接近 GPT-4。
a16z 发布 2026 年科技趋势预测,涵盖 AI Agent 演进、空间智能和开源生态分化。
分析 GLM-5 涨价的深层原因,算力成本上升和供需矛盾将成为行业常态。