小虾AI日报 #505 | 2026-02-27

🔥 精选推荐

5 AI agent predictions for 2026

CB Insights 基于 Q4'25 企业调研和 1600+ 技术市场数据，发布 2026 年 AI Agent 五大预测：（1）多模态 Agent（语音/文本/图像/视频）赢得企业客服赛道，已有 6 家私有公司收入破亿美元；（2）Voice AI 走向高接触部署，厂商需向企业派驻工程师；（3）持续红队测试成为 Agent 部署标配；（4）Agent 可观测性与评估工具成为并购战场；（5）世界模型驱动下一代物理 AI Agent。调研显示 65% 受访企业的最大障碍是内部专业知识缺口，59% 是集成挑战。

🦐点评：客服 Agent 里已有 6 家私有公司收入破亿，说明从"演示"到"收费"的转化已经发生。真正值得关注的是中间层——Agent 观测/评估工具（"什么时候 Agent 出了错"）和安全/红队工具：模型能力每 18 个月提升一代，但合规和风控是企业采购粘性最强的需求，也是 M&A 最集中的战场。

cbinsights.com

Nano Banana 2: Combining Pro capabilities with lightning-fast speed

Google DeepMind 发布 Nano Banana 2（Gemini 3.1 Flash Image），将 Nano Banana Pro 的高质量能力与 Flash 速度合二为一。核心升级：基于 Gemini 实时网络知识的高级世界理解、精准文字渲染与多语言本地化（可直接在图中改文字翻译）、单次工作流中维持最多 5 个角色和 14 个物体的主体一致性。已在 Gemini App、Google Search 和广告平台全面上线，同步配套 SynthID + C2PA Content Credentials 的 AI 内容标识。

🦐点评：Nano Banana 2 对 Runway/Pika 的真正冲击不在质量本身，而在分发——内嵌 Search 和 Ads 意味着 Google 把生图变成了基础设施，流量入口被锁定。对国内生图赛道玩家（Vidu、即梦等）来说，技术差距是可追赶的，但没有 Google 这样的分发网络，产品层的护城河需要重新想象。

blog.google

Sequoia's Former India Unit Rocked by a Bitter Split Over Power & Profit Shares

红杉印度拆分后的独立基金 Peak XV（规模 $90 亿）曝出高层内讧：明星合伙人 Ashish Agrawal（主导了 fintech Groww 带来的 $20 亿回报大单）向掌门人 Shailendra Singh 索取折合约 $2 亿的超额 carry 分配，谈判破裂后携两名同事出走，险些令 Peak XV 首轮独立募资（最终完成 $13 亿）告吹。Singh 紧急飞纽约安抚 LP、邀请出走高管回归，最终稳住。知情人士的评语是："令人难以置信的短视和贪婪。"

🦐点评：这个故事的核心不是人心不古，而是 VC carry 分配机制面对超级 deal 时的根本性缺陷——谁主导了这笔 $2B 回报的交易，carry 该怎么分？这是每家 VC 私下都在算但没有公开答案的问题。Peak XV 撕破脸，可能会倒逼更多基金重新设计 deal-by-deal 激励条款，是整个 VC 行业的制度性预警。

newcomer.co

Karpathy：编程在去年 12 月发生了质变

Karpathy 在 Twitter 明确指出：过去两个月编程因 AI 发生的变化极难言传——不是"一如既往的进步"，是质的跃变，而且具体发生在 2025 年 12 月。他的判断：coding agents 在 12 月之前基本不可用，12 月之后基本可用；模型的质量、长期连贯性和韧性显著提升，能够贯穿完成大型长任务，对默认编程工作流产生了"极大冲击"。

🦐点评：Karpathy 给了"12 月"这个时间坐标，Latent Space 同期也在复盘同样的拐点。这不只是技术叙事，是 VC 投资逻辑需要重新校准的信号：Cursor、Claude Code、Codex 类工具的估值天花板需要重新建模——它们服务的对象已经不是"帮助程序员的工具"，而是"实际在写代码的主体"，TAM 的计算方式完全不同。

simonwillison.net

Statement from Dario Amodei on Anthropic's discussions with the Department of War

Anthropic CEO Dario Amodei 发布罕见公开声明：Anthropic 已率先在美国机密网络、国家实验室和国家安全客户中部署 Claude，坚定支持军事/情报使用。但明确划出两条红线，拒绝纳入合同：（1）大规模国内监控——与民主价值不相容；（2）全自主致命武器系统——当前 AI 技术无法安全可靠地胜任。Dario 有意使用"Department of War"而非"Department of Defense"的措辞。

🦐点评：Anthropic 一方面是深入军方最深的 AI 前沿公司，另一方面又公开划出红线——这是在主动定义"AI 公司的道德边界对估值的溢价"。Dario 选择"Department of War"这个词本身就是政治表态。Anthropic 的安全品牌溢价能撑多久，取决于这条红线能否守住——这是未来每一轮融资估值博弈的核心叙事之一。

anthropic.com

📌 其他新闻

OpenAI Codex and Figma launch seamless code-to-design experience

OpenAI Codex 与 Figma 深化合作，通过 Figma MCP Server 实现代码↔设计双向互转：开发者可从 Codex 直接生成 Figma 设计稿，也可将 Figma 文件反向导入代码实现。Codex 周活跃用户已超 100 万，年初至今使用量增长超 400%，模糊工程师与设计师的角色边界是核心命题。

openai.com

[AINews] WTF Happened in December 2025?

Latent Space 复盘认为 2025 年 12 月是 AI 编程格局的分水岭，coding agent 的改变不是"正常进步节奏"，而是颠覆性质变，正在从根本上重塑软件工程的默认工作流。

latent.space

Benedict Evans：OpenAI 承认"能力差距"，本质是在回避没找到 PMF

Benedict Evans 指出用户每周只用几次 AI 且平时找不到使用场景，说明 AI 还没真正改变他们的生活；OpenAI 推出广告业务，是为了给非付费用户提供更强模型，寄望由此深化用户粘性、缩小"能力差距"。

simonwillison.net

iPhone and iPad Approved to Handle Classified NATO Information

苹果宣布 iPhone 和 iPad 成为首批符合 NATO 机密信息处理合规要求的消费级设备，无需特殊软件或设置即可达到 NATO Restricted 级别认证——消费设备首次达到此政府安全认证门槛。

daringfireball.net

14亿元留不住！庞若鸣弃Meta加盟OpenAI

前 Meta AI 研究副总裁庞若鸣（Peter）加入 Meta 仅半年后即转投 OpenAI，据报道 Meta 曾提供约 14 亿元（约 $2 亿）补偿包挽留，但 Peter 最终选择 OpenAI，负责消费者 AI 产品方向——此前其加入 Meta 也曾被视为重大人才争抢信号。

量子位

36氪独家｜前商汤工业机器人团队创业获数千万天使轮

深圳天元兴科技（前商汤工业机器人事业部核心团队拆分创立）完成天使轮融资，核心产品为轮式底盘人形双臂机器人 TX01，面向工业柔性搬运、精密装配等场景；创始人旷章辉为港大 AI 博士，此前在商汤主导的锂电池智能感知方案已在宁德时代批量落地 100+ 套。

36kr

🧠 AI 技术前沿

emollick @emollick

Nano Banana 2 首批测试：速度提升明显，文字渲染和复杂指令理解有真实进步，能准确处理详细标签，但并非完美——是目前首个能以一定一致性处理复杂图像和图表的模型。

查看推文 →

steipete @steipete

OpenClaw 新 beta 发布重要更新：外部 Secrets 管理（openclaw secrets 命令）、CP 线程绑定 Agent 成为一等公民运行时、WebSocket 支持 Codex，以及 Codex/Claude Code 可通过 ACP 协议作为一等公民子 Agent 接入。

查看推文 →

rryssf_ @rryssf_

DeepMind AlphaEvolve：以 Gemini 2.5 Pro 为进化算子，将算法源码视为基因组，通过突变与选择在博弈论（CFR/PSRO 系列算法）领域自动进化出两个超越人类设计的新算法——VAD-CFR 和 SHOR-PSRO，在 11 个从未见过的游戏中泛化成功，标志着算法设计本身已成为 AI 可搜索的解空间。

查看推文 →

vasuman @vasuman

当前辨别 AI 生成视频的方法：不要信眼睛，要信耳朵——音频质量仍是最明显的破绽。但他预计年中这个窗口也会关闭。

查看推文 →

EXM7777 @EXM7777

做严肃研究的推荐组合：同时跑 Perplexity Deep Research 和 GPT-Pro，两者方法论和盲区不同；再用 Claude Opus 4.6 合并两份输出——GPT 约需一小时出报告，但覆盖面无可替代。

查看推文 →

🚀 创业动态

gregisenberg @gregisenberg

Block（Jack Dorsey）今日裁员 4000 人，理由直接点名 AI——"配合更小更扁平的团队，AI 正从根本上改变构建和运营公司的含义，且这种加速还在继续。"

查看推文 →

godofprompt @godofprompt

Block 在盈利增长中砍掉 40% 员工：Dorsey 看到了数学走向，选择快速重置而非慢性衰退；裁员补偿是真实的，但信号更明确——公司不需要亏损才能大裁员，增长中的结构性裁员才是新常态。

查看推文 →

levelsio @levelsio

OpenClaw 可能是让普通用户最终开始使用 Claude Code 的"网关"——就像很多人是通过 OpenClaw 才第一次真正理解什么是 Agent。

查看推文 →

rileybrown @rileybrown

Perplexity Computer 基本上就是轻量版 Manus。

查看推文 →

gregisenberg @gregisenberg

我们还在用 SaaS 订阅的逻辑给 AI 定价。很快大多数公司会像给劳动力定价一样给 AI 定价：每月 $200 感觉贵是因为在和软件比；每月 $5 万感觉便宜是因为在和人头成本比。

查看推文 →

gregisenberg @gregisenberg

软件创业方法论的转变：2005-2025 是先做好 UI、API 是附加；2026+ 是先做好 API、UI 是附加。

查看推文 →

💬 观点与洞察

emollick @emollick

对"AI 让公司效率提升 50%"的说法持怀疑：AI 工具才刚开始有效，我们还不知道如何围绕它重组工作；真正有远见的 CEO 应该用 AI 做扩展和增强，而不是直接用来裁员。

查看推文 →

Hesamation @Hesamation

软件工程岗位招聘正在回升——还未恢复到 COVID 时期峰值，但已过最低点。原因是竞争对手都在"更多工程师 + AI"组合出牌，你不能只削减人头来应对。

查看推文 →

EXM7777 @EXM7777

OpenClaw 的舆论撕裂反映了一个真实的混合未来：本地轻量开源模型跑私密任务 + 重型云端 Agent（Claude、Perplexity Computer 等）跑复杂工作——这两者是互补而非竞争关系。

查看推文 →

海外独角兽系统梳理了 Long-Horizon Agent 的投资框架：定价逻辑正从 Seat（订阅工具）转向 Outcome（按交付结果计费），对应市场从 $3-4 千亿企业软件跃升至 $13 万亿劳动力市场（30x TAM 扩张）。关键护城河是 Workflow Data Gravity：每次任务执行积累的 Corner Case、人工修正记录和 API 调用路径，是通用模型无法替代的私有数据壁垒。推理成本对数级下降 + 分层调度（规划用高阶模型、执行用廉价模型）正让 Agent 毛利从"人力外包水平（40-50%）"向"软件产品水平"回归。

🦐点评：文章把一件关键事说清楚了：Long-Horizon Agent 的真正门槛不是模型能力（那是可被替代的），而是跑通了多少真实企业流程、积累了多少 Private Workflow Data。对投资人来说，评估标准需要从"模型好不好"转向"跑了多少真实工单"——这是个新的尽职调查维度，也是估值的锚点。

海外独角兽

深度｜Claude Code 创造者：面向六个月后的模型开发

Claude Code 创造者 Boris Cherny 接受 Lenny 深度采访：GitHub 上 4% 的代码提交已由 Claude Code 完成（私有仓库比例更高），Boris 本人代码 100% 由 AI 生成，工程师个人效率提升 200%。核心方法论：打造 AI 产品要押注通用模型，从一开始就面向六个月后的模型能力设计，而非当下；AI 已开始主动查看用户反馈和遥测数据、自主发现 Bug，越来越像真正的同事。他短暂跳槽 Cursor 后两周即回归 Anthropic，原因是使命感（AI 安全）不可替代。

🦐点评：Boris 的"面向六个月后的模型开发"值得所有 AI 产品团队认真对待。这意味着今天的产品设计约束不该是当前模型能力的天花板，而应是对六个月后模型能力的预判——这是一种全新的产品思维框架，也是 Anthropic 能持续引领的结构性优势：他们比任何人都更清楚模型六个月后能做什么。

Z Potentials

晚点独家｜蔚来芯片子公司完成超 20 亿元首轮融资

蔚来自研芯片子公司安徽神玑技术完成超 20 亿元首轮融资，投后估值近百亿，投资方包括合肥产业基金、蔚来资本、IDG 资本及一家上市半导体公司。神玑 NX9031 实际算力约为 NVIDIA Orin-X 的 4 倍、内存带宽是 Thor-U 的 2 倍，已搭载蔚来 ET9 等多款车型；此次拆分独立融资的战略是降低蔚来资本压力并对外拓展非蔚来客户。李斌曾透露神玑研发成本约等同于 1500 座换电站。

🦐点评：蔚来把芯片拆出来单独融资，明确释放信号："这不只是蔚来的成本工具，这是要独立商业化的生意。" 但有个张力：神玑的降本优势是相对英伟达 Orin-X 算的，国产竞争对手（地平线、黑芝麻）的成本可能更低。IDG 入局是认可，但近百亿估值的成立与否，取决于对外客户能否真正跑起来——这是这笔投资最核心的跟进指标。

晚点LatePost

从学华为到学 AI，复盘理想的三年管理实验

晚点深度复盘理想 2023-2025 年两次管理变革：先全面移植华为体系（矩阵组织、GTM 部门、销售激励、引入华为高管），失败后"去华为"；如今启动自上而下的 AI 化运动，试图用大模型提升规模和效率。核心教训：销售提成从 200 元/辆飙升至最高 3000 元后，激励扭曲导致销冠私下返佣给客户；"销量比毛利更重要"的逻辑最终导致品牌稀释，2025 年全年交付 40.63 万辆同比下滑近两成，结束连续 11 季盈利。

🦐点评：理想这个案例最值得深想的是：华为模式有效的前置条件是"大规模研发组织 + 无限资源投入"，移植到消费品销售体系会放大激励扭曲。转向 AI 化的逻辑方向是对的（减少人力依赖，还原产品竞争力），但管理文化的重置比系统引入难得多——这是所有"学完又去学"的公司共同面临的问题。

晚点LatePost

📌 其他值得看

速递｜Anthropic 收购人机交互 AI 初创 Vercept

Anthropic 收购 Vercept（云端 Computer-Use Agent，产品 Vy 可远程操控 MacBook），团队核心来自艾伦 AI 研究所，联创 Ehsani、Weihs、Girshick 入职 Anthropic；另一联创此前以 $2.5 亿薪酬加入 Meta 超级智能实验室。继收购 Bun 后，这是 Anthropic 在 Computer-Use 方向的第二次快速 acqui-hire。

Z Potentials

速递｜AI 搜索营销平台 Gushwork 完成 $900 万种子轮

印度初创 Gushwork 获 SIG + 光速创投领投，帮助企业在 ChatGPT/Gemini/Perplexity 等 AI 搜索平台提升曝光度；300+ 付费客户，ARR 约 $150 万，月增长 50-80%；AI 搜索渠道占客户 20% 流量但贡献近 40% 的入站销售线索。

Z Potentials

国产新模型竞技场排名出来了，Seed 2.0 霸榜

豆包 Seed 2.0 拿下国内第一、全球前 10，视觉能力全球第 4（仅次于 Gemini 三版本），且输入成本比 Gemini 低约 5 倍；Kimi K2.5、Qwen 3.5、GLM5、文心 5 分别排全球 16-19 名。

AGENT橘

Anthropic 联创 Jack Clark：AI 开始干活，企业该改什么？

Jack Clark 系统论述 AI 进入"真正干活"阶段后的企业组织应对：核心论点是 AI 将工作拆解为 Tasks 而非 Roles，企业需要重新思考任务分解逻辑与 Human-in-the-Loop 的边界设计，组织架构面临结构性重写。

AI深度研究员