🔥 精选推荐
Stratechery 拆解了 OpenAI 内部备忘录——关于如何在企业市场正面迎击 Anthropic。OpenAI 对 Anthropic 在编程和企业级 Agent 领域的领先位置高度警觉,正全力推进 Frontier 平台和企业级定制方案。同时 Amazon 在这场竞争中的角色愈发关键:作为 Anthropic 最大股东和 AWS 的分发渠道,Amazon 实际上在押注两边——既投 Anthropic,又通过 Bedrock 接入 OpenAI。
🦐点评:这份备忘录最有价值的信息不在战略宣言本身,而在泄漏的事实——Thompson 说得对,AI 实验室的"内部"备忘录几乎都是故意让记者看到的。OpenAI 选择此时让外界知道它在全力追赶 Anthropic 的企业业务,本质是在给企业客户发信号:"别锁定在 Anthropic 上,我们马上追到"。对 to-B AI 赛道的创业者来说,两强争夺企业市场意味着 API 价格还会继续下压,窗口期在缩短。
Lenny Newsletter 邀请两位顶尖 AI Agent 课程讲师 Hamza Farooq 和 Jaya Rajwani 撰写了一份 Agent 优先级框架。核心论点:企业里 5-10 个 Agent 计划放在同一个 roadmap 上比较是行不通的,因为不同类型的 Agent(信息检索型、流程自动化型、自主决策型)在架构、团队需求、LLM 成本上差了几个数量级。文章提供了三层分类法和具体的优先级决策树。
🦐点评:这是目前看到的最实用的 Agent 优先级框架。核心洞察是"并非所有 Agent 都需要同等投入"——一个 RAG copilot 可能 PM 用 n8n 六周就能搭好,一个自主交易 Agent 却需要 ML 团队六个月。对投资人来说,在评估 Agent 创业公司时最该问的不是"你在做什么 Agent",而是"你的 Agent 处在哪个复杂度层级,你的团队配置是否匹配"。
OpenAI 正式推出 GPT-5.4-Cyber——一个专为网络安全防御者微调的模型,并扩大 Trusted Access for Cyber 项目的覆盖范围。背景是 Anthropic 刚刚因 Mythos 的网络安全能力引发广泛关注,OpenAI 选择在此时宣布自己的安全模型,定位是"赋能防御方"而非攻击方。模型仅向经过审查的安全研究机构和企业开放。
🦐点评:AI 网络安全正在从"能力演示"阶段进入"产品化"阶段。OpenAI 的 GPT-5.4-Cyber 和 Anthropic 围绕 Mythos 的安全叙事,本质上是在争夺同一个市场定位:成为企业安全团队的标配 AI 工具。值得注意的是"仅向审查机构开放"的发行模式——这可能成为 AI 安全产品的标准分发方式,也意味着该赛道的创业公司需要同时具备技术能力和合规资质。
📌 其他新闻
英国 AI 安全研究所评估了 Claude Mythos 的网络安全能力,结论令人震惊:AI 正在让攻防双方的能力同时指数级增长,网络安全开始像"工作量证明"——攻击成本接近零,防御必须持续投入才能保持安全。
Amazon 宣布收购卫星通信公司 Globalstar,同时与 Apple 达成协议继续为 iPhone 和 Apple Watch 提供卫星服务。Amazon 借此强化 Project Kuiper 卫星互联网布局,同时锁定 Apple 作为卫星服务客户。
a16z 政策团队深度分析美国州级 AI 立法的宪法困境:法院需要对州法做成本效益分析,但在 AI 领域几乎不可能获得足够的证据来完成这种分析。各州"拼凑式"监管对小型创业公司的合规成本打击尤其大。
斯坦福 2026 年 AI Index Report 核心结论之一:中美在大模型性能上的差距已基本消失。AI 采纳率达 88%,SWE-bench Verified 从 60% 涨到接近 100%,五分之四的大学生在用生成式 AI。
李开复和陆奇同时押注的 Harness 智能体公司由李笛带队,4 个月完成 2 轮融资,备齐 3-5 年粮草。团队即将发布最新成果,市场对 Agent 基础设施层的投资热度持续升温。
六维力传感器头部企业蓝点触控完成超亿元 C+ 轮,由宁德时代旗下溥泉资本、智元机器人、银河通用联合投资。这是近一年内第三轮过亿元融资,人形机器人核心零部件赛道持续获得产业资本重注。
Newcomer 深度报道 Shield AI 的核心产品负责人 Armor Harris——一位 SpaceX 出身、得到 Musk 信任的 33 岁工程师。他正带领团队研发自主战斗机无人机,Shield AI 在国防科技 AI 赛道的估值持续走高。
🧠 AI 技术前沿
AI 模型版本号严重失真——按 GPQA 每 0.1 版本的实际提升来看,Claude 3.7 应该叫 4.4。版本号让普通用户严重低估了模型能力的真实跃迁。
查看推文 →
未来几个月的心智模型:模型在已有优势领域(如编码)会变得非常强,但弱项(如长篇小说)依然不变。上一次 jagged frontier 形状发生根本改变,还是 o1 和 Reasoner 的出现。
查看推文 →
OpenAI 正在为 Mythos 发布做准备,GPT-5.4-Cyber 是 GPT-5.4 的安全微调版本。未来几年的互联网会非常有意思。
查看推文 →
GPT-5.4 Pro 又解决了一个 Erdős 数学难题。AI 在数学领域的能力边界持续扩展。
查看推文 →
拿 35B 参数的 Qwen 和 5T 参数的 Opus 做对比是 next-level 的操作——"这个味道和肉一模一样"的素食主义者能量。
查看推文 →
Anthropic 已经集齐了 OpenClaw 的所有拼图:Claude Code Routine 允许定义事件驱动的定时任务——GitHub 自动化、PR 自动 review、自动修复,全部 24/7 无人值守。
查看推文 →
用博弈论和商业策略框架训练 Hermes Agent 作为私人决策顾问,注入个人背景和沟通风格——AI 个人化定制的又一个实际案例。
查看推文 →
Anthropic 版的 OpenClaw 已成现实——Claude Code 的 Routine 功能让 Agent 变成了真正的自动化工作流引擎。
查看推文 →
Agent 失败不是 Markdown 文件的问题,而是仓库没有结构。文件组织方式(/audits、/specs、/reviews)决定了 Agent 能否跨仓库学习。
查看推文 →
🚀 创业动态
所有人都在构建同一个东西——超级 App 竞赛正式开启。竞争会创造加速,最终是 AI 实验室之间的正面对决。
查看推文 →
Claude Code 刚上线 Routines:设定触发条件,指向你的项目,合上笔记本它照样 24/7 在服务器上跑。Larry Ellison 说的"自动化一切"正在兑现。
查看推文 →
Varick 增长太快已经无法公开讨论——但正在招高级工程师。Applied AI 最快的增长公司之一。
查看推文 →
OpenClaw 新版本发布,maintainer 团队在创始人不在的情况下独立完成——开源社区自运转的标志时刻。steipete 即将上 TED 演讲。
查看推文 →
构建通用 Agent 没有意义——一旦你有了一点势头,前沿实验室就会来抢你的市场。残酷但真实。
查看推文 →
Sub-agents 强得离谱——Agent 嵌套 Agent 的模式正在释放全新的生产力层级。
查看推文 →
从零开始的路线图:找一份轻量工作覆盖房租 → 开副业为本地企业集成简单 AI Agent → 用 Codex 当杠杆做到一人等于十人。
查看推文 →
Claude Code 将承载所有用例,不需要另外做类 cowork 的界面——Agent 列表 + Agent + 产出物,三层就够了。
查看推文 →
下一个公司的方向已经非常明显,痛点就在那里。真正需要的不是创意,而是风险承受力。
查看推文 →
💬 观点与洞察
版本号已经不是理解模型能力的有效方式了。如果你不紧跟行业,会以为 5.4 比 5 只强一点、4.6 比 4 只强一点——事实远非如此。
查看推文 →
前沿模型的全球竞赛中,真正有实力的只有美国和中国。美国三大实验室保持着持续领先,但以月而非年计。
查看推文 →
38% 的美国人住在距数据中心 5 英里以内,但住在附近对公众态度几乎没有影响。未来大部分数据中心将转向农村地区。
查看推文 →
AI 每次渐进式提升都会在经济关键领域引发离散式跳跃——因为此前的 AI 能力水平在某些工作环节形成了瓶颈,一旦瓶颈释放,效果看起来像量子跃迁。
查看推文 →
GitHub COO Kyle Daigle:"现在是做开发者最好的时代——总得有人告诉 Agent 该做什么,这只有人类能做。"
查看推文 →
最贪婪、最低效的管理层正在裁掉数千人来削减成本,但过去十年公司里唯一不变的低效环节——他们自己——却安然无恙。
查看推文 →
AI 治愈了 builder's block,然后给了我们 builder's paralysis。工具太多,反而不知道该建什么了。
查看推文 →
Zuck 在 Meta AI 实验室上全力投入,不是在闹着玩。Meta 的 AI 战略野心正在加速兑现。
查看推文 →
每个 AI 实验室都在构建"超级 App"——所以不要再做 App 了,去做喂养它们的基础设施:Harness 插件、Skill 层、模块化系统。
查看推文 →
"为什么不直接用 Claude?"——因为 Claude 不创建审计日志、不执行全组织权限、不告诉 IT 团队谁在碰生产数据。企业需要的不是聊天框,而是治理层。
查看推文 →
"We democratize creation via an MCP for your agent"——这些词汇里没有一个出现在圣经里。AI 话术通货膨胀已达顶峰。
查看推文 →
给我一台 MacBook Air、一个 Codex 和 $100 的 ChatGPT 订阅,我能干掉 10 个人的团队。
查看推文 →
🔥 精选推荐
Lenny's Podcast 专访 Anthropic 增长负责人 Amol Avasare,揭示了一组惊人数字:约 40 人的增长团队在 14 个月内推动 ARR 从 72 亿元飙升至 1368 亿元。Amol 靠一封 Cold Email 获得这份工作,团队分为横向(增长平台 + 变现)和纵向(B2B、代码、知识工作者、API)两条线。核心金句:"Claude is growing itself at this point."
🦐点评:300 倍增长、40 人团队——这组数字本身就是对"AI 公司需要多少人"这个问题的最极端回答。Anthropic 的增长模式本质上是 product-led growth 的极致演绎:Claude Code 让开发者自传播,API 让企业自接入,几乎不需要传统的销售漏斗。对 VC 来说,这意味着评估 AI 公司时"团队规模"这个指标可能需要彻底重新校准——40 人创造的收入规模,传统 SaaS 公司需要 4000 人。
AI 保险公司 Corgi 的创始人完全没有保险行业背景(来自游戏行业),成立不到半年 ARR 超 4000 万美元,累计融资 1.08 亿美元。上线首日 1000+ 创始人完成保险报价。核心方法论:把保险当系统工程问题解决,找出每一个让人变慢的摩擦点然后逐一清除。极端企业文化包括 24 小时咖啡馆、自办报纸、员工住进办公室。
🦐点评:Corgi 的故事验证了一个越来越清晰的模式——AI 在"古老、受监管、不性感"的行业里反而能创造最大的结构性套利。保险业的核心痛点是信息处理和流程摩擦,而这恰好是 AI 最擅长的。6 个月 4000 万 ARR 的数据意味着产品确实命中了真需求,但极端文化(七天工作制、住进办公室)的可持续性值得观察。
斯坦福 HAI 发布 2026 年 AI Index Report,423 页。15 条核心要点包括:AI 能力没有停滞还在加速、行业贡献超 90% 前沿模型、中美模型性能差距基本消失、组织采用率达 88%、五分之四大学生在用生成式 AI。新增 AI 与科学、AI 与医疗两个独立章节,以及 AI 主权分析框架和生成式 AI 消费者价值估算。
🦐点评:今年报告最值得投资人关注的信号是两个"消失":中美差距消失(意味着中国 AI 公司在全球市场的竞争力被低估),以及"AI 是否在减速"的叙事消失(SWE-bench 从 60% 到接近 100%)。88% 的组织采用率也意味着 AI 投资正从"要不要用"切换到"怎么用好",对做 AI 实施和集成的服务商是利好。
📌 其他值得看
CREAO AI 完成千万级美金新一轮融资,Prosperity7 Ventures(阿美风投)领投,经纬、云启、红杉中国等老股东跟投。不到一年累积超 3000 万美元融资。核心产品是 Agent OS——AI 既造工具,也跑工具,形成自闭环系统。
与其说 AI First,不如说软件工程 First。AI 时代人成了瓶颈——PM、QA、部署每个环节都比 AI 慢。解法是全链条自动化:AI 写代码、AI 审查、AI 测试、AI 部署、AI 监控、出问题自动回滚。前提是你得先有足够好的自动化测试基础。
一位 8 年 PE/VC 从业者用 Hermes(支持持久记忆的 AI 工具)三周后的深度评测。核心痛点:传统 AI 的"失忆症"——关掉会话一切归零。Hermes 的记忆持久化让 AI 真正成为可积累的工作搭档,每月成本仅 50 块。
哈佛独立 AI 实验室 Engramme 正在洽谈约 1 亿美元融资,估值讨论高达 10 亿美元。创始人是前哈佛医学院教授 Gabriel Kreiman,方向是"大型记忆模型"——让 AI 访问个人数字生活数据并自动呈现相关信息,无需用户提示。
日本政府向芯片初创公司 Rapidus 累计注入 2.6 万亿日元(163 亿美元),目标 2027 年量产 2 纳米芯片,首个客户为富士通。日本在先进制程赛道的国家级押注持续加码。
轻舟智航 600 人团队在算力受限条件下做出超预期的自动驾驶体验——在被认为"不够用"的地平线 J5 芯片上实现高速 NOA,又在 J6M 上跑通城市 NOA。创始人于骞的核心哲学:在极限约束下做出超额表现。