🔥 精选推荐
Gary Marcus 指出三个冷静看待 Mythos 的理由:其 Firefox 漏洞利用测试中实际关闭了沙箱,更多是概念验证而非即时威胁;Hugging Face CEO Clem Delangue 团队用小型开源模型复现了 Anthropic 展示的 8 个漏洞中的大部分分析;Ramez Naam 的 ECI 标准化分析显示 Mythos 基本在趋势线上,并非断崖式突破。Marcus 的结论是"我们在一定程度上被操纵了"。
🦐点评:Marcus 的批评指向一个 VC 必须正视的问题——Anthropic 的"太危险不能发布"叙事在商业上完美:既建立了能力品牌,又不用面对公开基准测试的检验。如果 Clem 说的对——开源小模型能复现大部分结果——那 Mythos 的真正壁垒可能不在模型本身,而在 Anthropic 围绕它构建的限制发布+企业独占的分发机制。
Ben Thompson 对话纽约时报 CEO Meredith Kopit Levien,核心议题是人类专业知识作为抵御聚合器和 AI 冲击的护城河。NYT 的策略是在 AI 时代加倍投入人类编辑判断力和专业调查能力,用付费墙保护高价值内容。
🦐点评:NYT 的"人类专业能力"赌注本质上是在赌 AI 生成内容的信任赤字——读者愿意为"这是真人记者写的"付费。短期内这是成立的,但 Mythos 级别的模型如果真的能独立调查和写作,NYT 的护城河就从"内容质量"退缩到"品牌信任"。对投资人来说,这是整个媒体/内容行业的缩影:AI 时代,分发能力比生产能力更值钱。
Steve Blank 分析乌克兰和伊朗战争中无人机对传统防御体系的颠覆。美国发现防空系统(THAAD、爱国者)设计用于应对数十到数百目标,面对数千架无人机的不对称攻击力不从心。传统陆军作战模式被根本改变——地面上的一切都在无人机监视和打击范围内。
🦐点评:当防御成本远高于攻击成本时,整个军事装备的投资逻辑被重写。一辆价值数百万美元的坦克可以被一架几千美元的无人机摧毁——这不是线性改进,是成本比的结构性倒置。对 defense tech 投资来说,反无人机(C-UAS)和无人机蜂群是当下最明确的赛道机会,Anduril、Shield AI 等公司的估值逻辑正在被战场验证。
OpenHands 创始人 Robert Brennan 接受 CB Insights 专访,阐述其作为最大开源 AI 编程代理的市场定位、客户需求理解和竞争策略。OpenHands 定位在开源生态中构建 AI 驱动的软件开发自动化。
🦐点评:开源 AI 编程工具赛道正在形成"Claude Code/Codex 商业化 vs OpenHands/OpenClaw 开源化"的双轨格局。OpenHands 需要回答的核心问题是:当 Anthropic 和 OpenAI 持续降价且能力飞速提升时,开源编程 Agent 的差异化到底在哪?答案可能不在模型层,而在定制化和数据主权——企业不愿把核心代码库交给云端 API。
📌 其他新闻
Qdrant 创始人 Andre Zayarni 介绍向量数据库市场定位。随着 RAG 和 Agent 架构普及,向量数据库成为 AI 应用基础设施的关键一环。
Skyfire CEO Amir Sarhangi 阐述 AI 与支付交叉领域的市场机会。当 Agent 需要自主完成交易时,支付基础设施是不可绕过的一环。
Hugging Face 发布 Waypoint-1.5,在普通消费级 GPU 上实现高保真交互式世界生成,降低了世界模型的硬件门槛。
Sentence Transformers 库新增多模态 Embedding 和 Reranker 支持,跨文本和图像的统一向量表示将简化多模态 RAG 管线构建。
当 AI Agent 开始自主安装依赖包时,供应链攻击风险被放大。文章提出 lockfile 验证、沙箱隔离和冷却计时器等防御策略。
光年之外并入美团后推出 AI 浏览器 Tabbit 进入公测,版本号 0.25,用户留存在行业优良线以上。用 AI 帮知识工作者在浏览器场景中自动化工作流。
君联资本、高瓴创投、弘晖基金联合投资,INAIR Pod 搭载自研空间操作系统,支持最多 6 块虚拟屏幕和 AI 助手能力。
马斯克在 OpenAI 诉讼中表态放弃赔偿金,但要求奥特曼离开 OpenAI 董事会,并要求 Greg Brockman 交出所有股权收益。诉讼走向可能影响 OpenAI 转型进程。
🧠 AI 技术前沿
对当前前沿 AI 格局的全面盘点:美国闭源模型(Google/OpenAI/Anthropic)继续领先且可能出现递归自我改进迹象;xAI 暂时掉出前沿;Meta 今天带着闭源 Muse Spark 重新入场;所有美国前沿实验室都放弃了开放权重,开源模型只能指望中国实验室。
查看推文 →
AI 能力的"参差不齐"容易被过度聚焦。LLM 虽然在编程等可验证领域被优化,但在企业战略、医疗建议、写作、共情和创意生成等方面也表现不差——通用性本身就是一个惊喜。
查看推文 →
AI 能力理解差距正在扩大:很多人基于去年免费版 ChatGPT 的体验形成了对 AI 的判断,但当前前沿模型的能力已经远超那个版本。这种认知滞后正在造成越来越大的信息不对称。
查看推文 →
一个 7B 参数模型在深度研究任务上超越了 Gemini-2.5-Pro、GPT-4o 和 GPT-5.4——关键在于它能从自身搜索历史中学习,无需重训练,只靠一个记录成功和失败的记忆系统。
查看推文 →
Anthropic 推出 ADVISOR 功能:用 Opus 做复杂规划,Sonnet 执行具体任务。结果是成本降低 11.9%,SWE-bench 多语言测试比纯 Sonnet 高 2.7%——接近 Opus 级智能但成本大幅降低。
查看推文 →
实测 Meta Muse Spark 比预期好——benchmark maxxed 但所有模型都这样。感觉介于 Sonnet 4 和 Opus 4 之间。期待后续的开源版本,Meta 可能正在恢复竞争力。
查看推文 →
开发者构建了 Claude Cowork 的免费开源替代品 Rowboat:100% 本地运行,支持任意 LLM,能自动从输入内容构建知识图谱并发现隐藏关联。支持语音、MCP 工具扩展和 Obsidian 兼容。
查看推文 →
🚀 创业动态
工程师现在最该做的事是学会成为顶级营销人。过去 20 年工程师是最稀缺的人,但 Claude Mythos 及后续模型正在终结这个时代。新的稀缺能力是理解人类行为——什么让人在凌晨 11 点点击购买。
查看推文 →
"我们找到了 GitHub MCP Server 的开发者"——OpenClaw 创始人发现并分享了 GitHub MCP Server 背后的核心贡献者。
查看推文 →
Amazon 将投入 $250 亿在密西西比州建数据中心,此前已裁员超 3 万人:2025 年 1 月裁 1700 人,10 月裁 1.4 万人,2026 年 1 月再裁 1.6 万人。
查看推文 →
Cursor VibJam 第 7 天——由 Cursor、Bolt 和 Glif 赞助的 AI 编程竞赛持续火热。
查看推文 →
💬 观点与洞察
有人指出 OpenClaw 之所以引发巨大反响,是因为这是第一次大规模非技术用户群体体验到最新的 Agentic 模型——此前他们只知道 ChatGPT 网页版。
查看推文 →
Codex 独自撑起一家 $8520 亿市值公司的重量——向 OpenAI 的 Codex 致敬。
查看推文 →
AI 能写出完整的全栈软件,但还是写不好文案——这个矛盾说明了什么。
查看推文 →
Karpathy 花几个月用 Python 脚本构建了自己的"第二大脑"系统。这里有一个 Claude 提示词能在 10 分钟内完成同样的事:上传你的素材,让 Claude 自动提取原子洞察、按概念聚类、双向映射关联、生成主索引。
查看推文 →
所有美国前沿实验室都已放弃开放权重。它们偶尔仍会发布优秀的开源模型(如 Gemma 4),但都是无法与闭源模型竞争的小模型。开源模型的未来全看中国 AI 实验室。
查看推文 →
🔥 精选推荐
汪滔十年来首次公开深度访谈。他修正了那句著名的"世界蠢得不可思议"——补上了后半句"我也是"。从 2006 年在深圳莲花村民居创业到今天,汪滔回顾了大疆 20 年的技术路径和组织哲学。这是理解大疆决策逻辑和汪滔个人认知演变的第一手资料。
🦐点评:汪滔消失十年后重新开口,时间点值得玩味——大疆正面临美国制裁升级和无人机市场从消费级向工业/国防级转型的双重压力。"我也蠢"的自我修正意味着大疆可能在为组织层面的重大转向做铺垫。对 VC 来说,大疆的供应链和人才溢出效应是中国硬科技生态最值得追踪的信号之一。
Nathan Lambert 和 Florian Brand 发布 ATOM Report,追踪约 1500 个开源模型的下载量、衍生模型、推理市场份额和性能数据。核心结论:中国开源模型在 2025 年夏天超过美国后,差距持续扩大。报告覆盖 2023 年 11 月到 2026 年 3 月的完整数据。
🦐点评:ATOM 报告用硬数据验证了 Karpathy 今天推文里的判断——美国前沿实验室全面放弃开放权重后,开源生态的话语权和技术方向正在被中国实验室接管。对投资人来说,这意味着两件事:一是围绕中国开源模型的工具链和应用层存在巨大的生态红利;二是如果美国进一步收紧出口管制,中国模型的领先可能反而加速——被制裁的玩家别无选择只能自研。
硅谷 VC Eclipse 完成 $13 亿募资,投资方向锁定 AI 基础设施、制造业和国防等实体产业。Eclipse 是 Nvidia 竞争对手 Cerebras Systems 的早期投资方。本轮包括 $7.2 亿早期投资和 $5.91 亿后期项目。
🦐点评:Eclipse 的 $13 亿"物理世界 AI"基金是一个明确信号——聪明钱正在从纯软件 AI 向"AI+实体"转移。这与 Steve Blank 今天文章里描述的无人机革命遥相呼应:当 AI 从聊天框走进工厂和战场,真正的投资机会在硬件-软件交叉点。Cerebras 的早期押注如果 IPO 成功,将为整个实体 AI 赛道提供退出范本。
Anthropic 发布 Claude Managed Agents,提供可组合 API 构建云托管 AI Agent。核心卖点是 Harness(Agent 编排引擎)——经过调优的编排循环自动处理工具调用决策、上下文管理和错误恢复,且随模型升级自动演进。Notion、Asana、Rakuten、Sentry 已在生产环境使用。
🦐点评:Anthropic 的 Managed Agents 本质上是在说"别自己造轮子了,用我的"——这是从卖模型 API 到卖 Agent 基础设施的关键一步。如果 Harness 成为 Agent 编排的事实标准,那所有 Agent 创业公司都变成了 Anthropic 生态的上层应用。这与 AWS 早年吃掉无数基础设施创业公司的路径如出一辙。
📌 其他值得看
三个 API 调用、十分钟搭建生产级 Agent 的实操教程。不需要自己搭 Docker 或写沙箱,降低了 Agent 开发的入门门槛。
字节推出 TRAE SOLO 独立端,定位不是 Vibe Coding 而是 Vibe Working——面向非技术用户的 AI Agent 工作台,解决 Claude Code 等工具门槛过高的问题。
西班牙初创公司 Xoople 开发卫星星座收集针对深度学习模型的精确地面数据,七年技术积累后从政府客户拓展到企业市场。
IDG 资本合伙人李骁军手机备忘录中的 52 条投资思考精选 20 条,来自一线 VC 的认知框架和决策方法论。
Single Grain 创始人 Eric Siu 花两个月搭建基础设施,给公司每个员工配置独立 AI Agent——能扫描行业趋势、写文章、做销售跟进,所有 Agent 共享同一个知识库"Single Brain"。
Nav Toor 上下文工程系列续篇,从理论转向实操——15 个可直接使用的模板,覆盖 AI 使用的完整操作系统。
Lindy.ai 把 AI 助理直接嵌入 iMessage,定价 $49/月,两步设置即用。不做新 App,而是出现在用户已有的短信列表里。