🔥 精选推荐

Google 向伯克希尔·哈撒韦发行股权,这笔交易释放了一个强烈信号:AI 基础设施的资本需求已经大到连 Google 都需要出让股权来融资。Ben Thompson 认为这标志着一个新时代——资本本身成为终极大宗商品,AI 竞赛的胜负将越来越取决于谁能以更低成本调动更多资本。需求端的爆发远超预期,未来的竞争格局可能由资本效率而非技术领先决定。
🦐点评:Google 给巴菲特发股权意味着连全球现金流最强的科技公司都撑不住 AI 基建的资本强度。如果 Google 都在做这种选择,那些依靠风险投资支撑 AI 基建的中小公司将面临更高的资本门槛。对 VC 来说,基础设施层的竞争已经变成"谁的资本成本更低"的游戏,纯技术创业在这一层几乎没有入场券了——应用层反而是更明智的赌注。
stratechery.com
GitHub COO Kyle Daigle 阐述了 GitHub 的 Agent 战略。Copilot 开创了 AI 编程时代,但 Agent 编码的爆发式增长正在给全球最大开发者平台带来前所未有的压力——代码审查、权限管理、工作流编排都是为人类设计的,Agent 的行为模式完全不同。GitHub 正在重新设计平台的底层假设,以适应"Agent 是一等公民"的新范式。
🦐点评:GitHub 面临的问题本质上是"当你的客户从人变成机器"的平台转型——类似当年电商从 B2C 转 B2B。Agent 贡献的 commit 数量已经在快速增长,但 GitHub 整套 UI、review 流程、权限模型都是为人设计的。谁先把开发者平台改造成 Agent-native,谁就拿到了 AI 编程时代的入口税。这对 GitLab 和所有 DevOps 公司都是一个紧迫的存亡问题。
latent.space
NVIDIA 一口气发布多个重磅产品:Cosmos 3 全模态物理 AI 模型开源、Nemotron 3 Ultra 推理模型、RTX Spark 消费级 AI PC。产品线覆盖从数据中心到端侧的完整 AI 计算栈。Cosmos 3 将世界生成、物理推理和动作生成统一到单一模型,开源策略意在让整个物理 AI 生态绑定在 NVIDIA GPU 上。
🦐点评:NVIDIA 同时在物理 AI、推理模型和消费端三线推进,最危险的不是某个单一产品,而是三层之间的数据和工具链闭环——开发者在 RTX Spark 上训练原型,用 Cosmos 3 做物理推理,最后部署到 NVIDIA 数据中心。Cosmos 3 开源是典型的"免费模型卖 GPU"策略:开源的模型才是最贵的锁定。对投资具身智能的 VC 来说,被投公司在 NVIDIA 栈上的依赖程度是一个需要重新评估的风险因素。
latent.space
微软一次性发布 7 款自研 AI 模型:MAI-Thinking-1(35B 参数推理模型,仅向精选合作伙伴开放)、MAI-Code-1-Flash(5B 参数,专为 GitHub Copilot 和 VS Code 设计的编码模型)、以及空间推理、语音、多模态等五个垂直模型。Simon Willison 注意到 MAI-Thinking-1 的 GPQA 和 Terminal Bench 2.0 得分"奇怪地低",但微软发布时难以直接试用这些模型。
🦐点评:微软 7 个自研模型同时发布,这不是在追赶 OpenAI 的前沿能力,而是在建自己的"模型供应链"。MAI-Code-1-Flash 只有 5B 参数却专为 Copilot 优化——微软想在最高频场景上摆脱对 OpenAI 的依赖。MAI-Thinking-1 得分偏低但还是发了,说明微软认为拥有自研推理能力的战略价值大于性能差距。OpenAI 和微软的关系正在从"独家合作"加速走向"各自建栈"。
simonwillison.net
OpenAI 发布《The Next Era of Knowledge Work》报告,Codex 正从编程工具向通用生产力平台扩展,覆盖研究、数据分析、工作流自动化和内容创作。用户群体从开发者扩展到分析师、市场人员和设计师。配合同日发布的 Codex 插件和站点功能,OpenAI 的意图很明确:把 Codex 打造成 AI 时代的知识工作操作系统。
🦐点评:Codex 从编程助手变"知识工作 OS"的野心,本质上是在赌"AI Agent 的入口不是 Chat,而是工作台"。如果成功,Codex 吃掉的不只是 IDE 市场,而是 Notion、Zapier、甚至部分 Salesforce 的场景。但这也意味着 OpenAI 的对手从 Anthropic/Google 变成了所有企业软件公司——战线拉得越长,每一条战线上的资源越薄。Claude Code 在开发者群体中 token 消耗占比近九成的现状也说明:在核心编程场景上 Codex 还没赢。
openai.com

📌 其他新闻

a16z 支持的 Special 宣布上线,定位为用 AI 改造美国关键行业的"操作系统"。方向是将 AI 深度嵌入传统行业的核心工作流,而非做通用工具。
a16z.news
a16z 提出视觉 AI 的下一阶段不是生成更好的图片/视频,而是输出代码形式的可编辑 artifact。从"输出像素"到"输出结构化代码",创意工作的可控性和可迭代性将大幅提升。
a16z.news
HCompany 发布 Holo3.1,一个可以在本地运行的 Computer Use Agent 模型。本地化意味着零延迟、无 API 费用、完全隐私——对企业部署 Computer Use 场景是一个重要的技术方向信号。
huggingface.co
OpenAI 发布 Codex 插件、站点和标注功能,让分析师、营销人员、设计师和投资人也能用 Codex 完成日常工作。这是 Codex 从"开发者工具"向"全员工具"扩展的具体落地。
openai.com
据 The Information 报道,Meta 今年计划发布多款智能眼镜,包括秋季新品和代号"Mojito VIP"的 12 月款。Meta 正在以"iPhone 式"多 SKU 策略密集布局 AI 眼镜品类,试图在苹果之前建立用户基数。
gizmodo.com
美国大型保险公司 Travelers 与 OpenAI 合作部署 AI 理赔助手,实现全天候客户支持和高峰期弹性扩容。这是传统金融行业大规模部署 AI 的又一个标杆案例,验证了 AI 在高度受监管行业中的落地路径。
openai.com
Ed Zitron 的最新长文挑战 AI 投资回报率的叙事,对 NVIDIA、Anthropic 等公司的商业模式提出系统性质疑。作为 AI 领域最知名的逆向声音之一,其分析值得作为压力测试参考。
wheresyoured.at

🧠 AI 技术前沿

AnthropicAI @AnthropicAI
Anthropic 对白宫新 AI 行政命令表态支持,称这是"加强美国 AI 领导地位的重要一步",并表示期待配合实施。AI 政策监管框架正在加速成型。
查看推文 →
AnthropicAI @AnthropicAI
Anthropic 扩大 Project Glasswing 计划,将 Claude Mythos Preview 的访问权限扩展到 15 个以上国家的约 150 个机构。Mythos 是 Anthropic 的安全前沿模型。
查看推文 →
cursor_ai @cursor_ai
Cursor 认为优秀的云端 Agent 体验远不止"把本地 Agent 搬到服务器"——需要持久化执行平台、强大的 harness,以及为 Agent 提供真实开发环境的工具和基础设施。
查看推文 →
emollick @emollick
微软 MAI-Thinking-1 仅从 benchmark 分数难以判断实际能力(GPQA 和 Terminal Bench 2.0 得分异常偏低),且微软在发布时很难让用户直接试用——这是微软 AI 产品的通病。分数低于 Meta Spark。
查看推文 →
emollick @emollick
法学教授用办公时间被问到的真实问题做测试:Gemini 2.5 对阵人类教授,由其他教授盲审打分。结果 Gemini 胜率 75%,且被评为"危害性更低"。更新的模型表现更好。
查看推文 →

🚀 创业动态

gregisenberg @gregisenberg
未来 10 年为 AI Agent 构建创业公司有超过 1000 亿美元的机会。互联网是为人类设计的(搜索→阅读→Demo→销售→购买),Agent 不走这条路——它们直接读文档、比价、调 API 完成交易。需要重新为 Agent 设计整套商业基础设施。
查看推文 →
rileybrown @rileybrown
一旦桌面应用内嵌完整浏览器并与 Agent 无缝协作,独立的垂直应用就没有存在意义了。用户要设计,Agent 就在内嵌浏览器中打开设计工具——不需要"Claude Design"或"Google Stitch"这样的独立产品。
查看推文 →
rileybrown @rileybrown
用 Codex 搭建了个人网站,设置为每周五自动更新数据和视频并自动部署。Codex 的自动化任务功能加上新推出的 Sites 功能,将大幅改变内部工具和个人网站的构建方式。
查看推文 →
marclou @marclou
为 DataFast 做了 Meta Ads 归因功能:连接 Meta 广告账户、拉取投放花费、匹配收入、展示 ROAS 和渠道归因。独立开发者自己做全栈商业化工具的效率越来越高。
查看推文 →
marclou @marclou
TrustMRR 平台第 97 笔创业项目收购:一个 AI 安全 SaaS 以 2000 美元成交,28 天内完成。微型 SaaS 的二级市场持续活跃,但 AI 安全 SaaS 仅卖 2000 美元也说明该品类的买方溢价很低。
查看推文 →

💬 观点与洞察

emollick @emollick
当前的"万能 AI 应用"看起来更像是聊天机器人和 IDE 的混合体,而不是真正为通用知识工作设计的产品。过于假设线性流程、只关注最终输出,缺乏与研究过程的连接,用户也没有足够的引导和选择空间。
查看推文 →
godofprompt @godofprompt
在 CLAUDE.md 里加一行"每次回复叫我 God"——看起来蠢,其实是 Claude 上下文退化的预警系统。Claude 不会突然崩溃,而是渐进式退化,当它不再叫你设定的称呼时,说明它已经开始忽略初始指令了。
查看推文 →
godofprompt @godofprompt
AI 电影 Hell Grind 成本拆解:总预算 50 万美元,其中 40 万美元给了算力。前 25 分钟生成了 16181 次,最终只用了 253 个镜头。每 15 秒素材需要 3000 词的 prompt,由 15 位专业导演和剪辑师花两周完成。"AI 让人人都能拍电影"这个说法在看完账单后完全站不住。
查看推文 →
shao__meng @shao__meng
在大厂的稳定感是虚假的——2026 年没有任何一家国内大厂的岗位是真正稳定的。AI 发展像湍急的河流,只有跳进去才能学到东西。个人品牌、一手知识和实践经验才是不随环境变化的真正资产。
查看推文 →
shao__meng @shao__meng
Cursor $10K Credits 用完后复盘:100% 时间在 Agent Windows 中工作,传统 IDE 界面一次没打开;有梯子时用 GPT-5.5 多,没梯子时用 Composer 2.5 多;Agent 输出默认不是 Markdown 这点不方便。5 月消耗约 $2K。
查看推文 →

🔥 精选推荐

字节跳动 Seed 团队进行架构调整,周畅的管理范围进一步扩大,具身智能业务被正式纳入核心业务线。这标志着模型大厂对世界模型和物理 AI 的战略升级——具身智能从"探索方向"变成了组织架构中的一等公民。
🦐点评:字节把具身智能并入 Seed 核心,而不是放在独立的创新孵化部门,这个组织决策本身就是一个信号——说明字节判断具身智能已经过了"看看能不能做"的阶段,进入了需要模型能力和数据资源全力支持的阶段。对国内具身智能创业公司来说,当字节把这件事当主营来做时,独立公司在人才和数据上的竞争难度会显著上升。
晚点LatePost
Atlan 联合创始人 Prukalpa 提出:赢得下一个十年的公司不是拥有最好模型的那个,而是上下文在复利积累的那个。模型本身的智能增长正在放缓,但企业可以通过构建高质量的上下文层(数据、流程、业务知识的结构化积累)让 AI 的实际表现持续提升。
🦐点评:这个判断对 VC 的投资逻辑有直接影响——如果模型层趋于同质化,那投"上下文基础设施"(数据编排、知识图谱、工作流引擎)的回报可能比投模型公司更确定。Prukalpa 的 Atlan 本身做的就是"数据目录+治理",自己的商业利益和这个判断高度一致,需要打折听,但底层逻辑是对的。
深思SenseAI
NVIDIA 发布 Vera CPU,性能是英特尔 x86 的 1.8 倍,同功耗下可多部署 40% 的 NVIDIA 加速芯片。OpenAI 和 Anthropic 已为 Vera 背书,三季度全面投产。NVIDIA 正式进入 CPU 市场,补全了从 CPU 到 GPU 到网络的全栈计算垄断。
🦐点评:Vera 的 1.8 倍性能差距不是关键——关键是"同功耗多部署 40% 加速芯片"。NVIDIA 做 CPU 的真正目的是让数据中心的每瓦功耗都尽可能多地分配给 GPU,CPU 只是 GPU 的陪衬。OpenAI 和 Anthropic 同时背书意味着前沿实验室已经在用了。英特尔和 AMD 在 AI 数据中心市场的 CPU 份额可能面临加速流失。
Z Potentials

📌 其他值得看

Anthropic 的安全专用模型 Claude Mythos 在三周内发现了 20 多个关键漏洞,但 token 消耗超过百万美元。OpenAI 也有类似的 GPT-5.5-cyber。AI 安全模型的效果显著但成本极高,商业化路径仍需探索。
Z Potentials
蓝驰和高瓴投资脑机接口公司 SiClink,关注从单向"读脑"到双向"重建感知"的技术跃迁。双向交互是脑机接口从功能代偿工具走向信息接口的关键转折。
Z Potentials
对 HeyGen 产品方向的批评性分析,认为其产品设计在"开历史倒车"。AI 视频工具在产品化路径上的分歧——是面向专业创作者还是面向自动化流水线,决定了完全不同的商业模式。
葬AI
Alex Lieberman 提出 AI 软件工厂五级成熟度模型:从 Level 0 手写代码到 Level 4 全自动流水线。多数企业自以为在 Level 2-3,实际还在 Level 0-1,差距在于流程标准化而非工具先进性。
深思SenseAI
MiniMax M3 展示了给无声视频自动补全音效和配乐的能力。多模态模型正在从"理解"走向"生成"各种感官维度的内容,视频后期制作工作流可能被大幅简化。
赛博禅心