🔥 精选推荐

Claude Code 的泄露源码揭示了一个惊人事实:其核心是一个 3167 行的确定性内核(print.ts),包含 486 个分支点和 12 层嵌套——本质上是经典的符号 AI。Anthropic 走的是神经符号路线:确定性符号循环与神经网络并行工作。AlphaFold、AlphaEvolve、AlphaProof 等 Google DeepMind 的重大突破也都是神经符号架构。Marcus 的核心论断是:聪明地加入符号 AI 比单纯 Scaling 更有效,纯 LLM 的创新叙事正在被改写。
🦐点评:如果 Marcus 的判断成立——Claude Code 的领先靠的不是更大的模型而是更好的符号工程——这对 VC 的投资逻辑有直接冲击。"谁有更多 GPU"不再是唯一的胜负手,"谁能更好地设计确定性执行层"才是。这意味着 Agent 赛道的壁垒可能不在模型端,而在工具链和编排层——一个资本密度低得多、但工程密度高得多的战场。
garymarcus.substack.com
一名 20 岁男子凌晨 3:45 向 Sam Altman 价值 $2700 万的旧金山住宅投掷燃烧弹,随后在 OpenAI 办公室附近被捕。Altman 事后发表长文,将 AGI 比作"至尊魔戒"——不应由任何单一实体掌控。更值得关注的背景是,2026 年 3 月美国爆发了历史上最大规模的反 AI 抗议,200+ 人同时包围 Anthropic、OpenAI、xAI 办公室,诉求涵盖能源消耗、就业替代和安全风险。科技 CEO 安保支出持续攀升(Zuckerberg 年超 $2000 万)。
🦐点评:从个人安全事件升格为行业系统性风险信号。OpenAI 正在筹备史上最大 IPO,而公众对 AI 的敌意正从线上情绪转化为线下行动——200 人同时抗议三大实验室是质变,不是量变。对投资人来说,"社会许可证"(social license to operate)正在成为 AI 公司估值模型中不可忽略的折价因子,尤其是数据中心选址、能源合规和雇主品牌方面。
36kr.com
a16z 领投、Jeff Dean 和 Biz Stone 等 45+ 天使投资人参与、种子轮 $3300 万的 AI 模型评估平台 Yupp,运营仅 22 个月即宣布关停。核心原因是 AI 从聊天机器人转向 Agent 的范式转移让其模型比较市场瞬间过时。剩余资金将返还投资人。创始人的反思是:在 AI 领域,你的产品分类可能在你找到 PMF 之前就消失了。
🦐点评:$3300 万种子轮、45+ 天使、顶级 VC 背书——所有"正确"的融资信号都在,但产品类别本身在 22 个月内蒸发了。这是 AI 投资中最危险的failure mode:不是执行失败,而是赛道消失。对 VC 来说,这案例的教训不是"看走眼",而是 AI 领域的投资窗口和产品生命周期之间存在结构性错配——你的尽调周期可能比赛道存续期还长。
36kr.com
这篇技术分析指出,Claude Code 真正的强项不是 Skills 而是 CLI 工具(GlobTool、GrepTool、FileReadTool)——确定性、零 token 消耗的原子操作。OpenClaw 被诟病的高 token 成本和不稳定性,根源在于依赖脆弱的浏览器自动化而非 CLI。文章提出三层架构:CLI(确定性执行)→ Skill(上下文编排)→ LLM(语义判断)。核心判断:"下一个真正的战场是 CLI 层"——Web/PC/移动端的 CLI 化改造才刚开始。
🦐点评:Anthropic 自己的 Cowork 设计负责人 Jenny Wen 几乎不用 Skills——这个细节比任何架构图都有说服力。如果 CLI 层才是 Agent 竞争力的真正来源,那投资逻辑需要翻转:不是"谁的 LLM 更强",而是"谁的工具链接口更干净"。这解释了为什么 Cursor 能在没有自研模型的情况下做到 ARR 过亿——它赢在 IDE 层面的确定性工程,不在模型层面。
36kr.com

📌 其他新闻

Meta 正在挖走 OpenAI 三名负责 Stargate 云和数据中心的高管,加入其新成立的计算部门。AI 基础设施人才争夺战持续升级。
theinformation.com
Meta 员工曾在内部排行榜上比拼"token 传奇"称号。但文章认为,除了最富有的科技巨头,大多数企业不会跟风——AI 炫耀性消费的窗口正在关闭。
theinformation.com
美联储主席鲍威尔和财长贝森特紧急召集华尔街 CEO 警告 Anthropic 新 Mythos 模型带来的系统性风险,SaaS 板块据报蒸发 $2 万亿市值。重大监管信号。
36kr.com
Flask 作者 Armin Ronacher 指出,AI 编程工具争论中"理性中间派"其实偏向不使用者——因为形成有根据的观点需要实际使用,而非使用者误以为自己的立场是中性的。
lucumr.pocoo.org
00 后联合创始人陈源培带队的灵初智能发布近 10 万小时人类操作数据集(其中 1000 小时开源),Psi-R2 模型登顶 AllenAI MolmoSpace 评测榜单,成功率比同类 VLA 模型高出近 10 倍。
qbitai.com
吉利旗下 eVTOL 公司沃飞长空完成近 10 亿元融资(2026 年低空经济最大单笔),两个月后即递交科创板 IPO。核心飞行器 AE200 仍在适航认证中——资本明显跑在产品前面。
36kr.com
Anthropic 推出面向长时间运行编程任务的多 Agent harness 架构,重构 AI 编程 session 的工作方式。
infoq.cn

🧠 AI 技术前沿

kloss_xyz @kloss_xyz
一周 AI 重大事件汇总:GLM-5.1 以 MIT 许可开源,在 SWE-Bench Pro 上超越 GPT-5.4 和 Claude Opus 4.6,可自主工作 8 小时;字节 Seedance 2.0 登陆美国,视频生成能力实现代际飞跃。"开源总是迟到"的叙事正在被改写。
查看推文 →
rryssf_ @rryssf_
清华大学开源语音模型 VoxCPM2 在语音相似度基准上碾压 ElevenLabs(85.4% vs 61.3%)。20 亿参数,200 万小时训练数据,Apache 2.0 许可,8GB VRAM 本地运行,无需 API 或订阅。企业语音 AI 的护城河正在被开源侵蚀。
查看推文 →
emollick @emollick
实验发现 LLM 生成的事实核查比人工标注获得更广泛的跨意识形态接受度——"AI Community Notes 在整个政治光谱中获得更多正面评价"。AI 在内容审核/信息治理领域的应用前景。
查看推文 →
Hesamation @Hesamation
呼吁 Claude/Codex 公开每日性能报告。"Claude 变笨了吗?"这个问题从 2024 年 Sonnet 3.5 就在问,至今仍无透明的公开基准监测。开发者社区对 LLM 可靠性和一致性的核心焦虑。
查看推文 →
steipete @steipete
OpenClaw 正在测试 GPT 的两种实验模式:strict mode(推动模型持续工作)和 Codex app server 作为 harness。AI coding agent 架构演进的一手信息。
查看推文 →

🚀 创业动态

godofprompt @godofprompt
用 $200/月复刻了年费 $32,000 的 Bloomberg Terminal。AI 对高壁垒 B2B SaaS 的颠覆案例——金融信息服务赛道的去中心化正在发生。
查看推文 →
levelsio @levelsio
Cursor VibJam 游戏开发大赛进入第 9 天,Cursor/Bolt/Glif 联合赞助,$35K 奖金池。参赛作品质量明显提升。Vibe coding 生态正在从个人实验走向社区化和商业化。
查看推文 →
egeberkina @egeberkina
Seedance 2.0 实操案例:生成网球比赛场景的影视级视频,展示角色一致性、环境控制和运动模拟能力。字节视频生成模型在全球市场的实际效果验证。
查看推文 →
gregisenberg @gregisenberg
"不知道今年有多少人在用 Claude、ChatGPT、Perplexity 来报税。"AI 正在渗透专业服务的毛细血管——税务 AI 是一个被低估的场景。
查看推文 →
EXM7777 @EXM7777
"OpenClaw 或 Hermes 听起来很酷……但 Claude Code + Telegram + 持久终端才是大多数人的最优解。"AI agent 工具生态正在形成明确的用户分层。
查看推文 →

💬 观点与洞察

emollick @emollick
AI 正在使互联网内容同质化——所有东西读起来都有"Claude 味"。写作教育将被迫从逻辑和清晰度转向风格差异化。"无聊感"可能成为内容消费者对 AI 生成内容的系统性反应。
查看推文 →
EXM7777 @EXM7777
AI 致富路径的分野:追热点能快速赚钱,但真正的大机会在于用 AI 放大个人独特专业经验。"你的壁垒不需要很牛——只需要够具体。你做过一次的事,用 AI 可以做一万次。"
查看推文 →
eptwts @eptwts
未来各行业专家将像开发者一样大量消耗 AI token。建筑师、工程师、律师都会有自己的 AI 编程工具。花大量 credits 学习使用这些工具,将成为专家的最佳投资。
查看推文 →
rileybrown @rileybrown
"如果你觉得现在针对 AI 和数据中心的抗议已经很严重……这才刚开始。我真的很担心。"AI 基础设施面临的社会阻力将持续加剧。
查看推文 →
Hesamation @Hesamation
"五角大楼与 Anthropic 的冲突现在完全说得通了。"AI 安全立场与国防应用之间的张力正在浮出水面。
查看推文 →

🔥 精选推荐

翻译自 Anthropic 官方博客"Seeing like an agent",作者为 Claude Code 团队工程师 Thariq Shihipar。核心内容:Agent 的工具设计不应模仿人类 GUI 交互,而应提供原子化、确定性的原语——Bash、文件读写、代码执行各有适用场景。文章详细拆解了 Claude Code 的工具集选择逻辑,以及为什么 Anthropic 选择让 Agent 操作文件系统而非模拟鼠标点击。
🦐点评:Anthropic 工程师的一手方法论直接回答了"为什么 Claude Code 比 OpenClaw 好用"这个问题——不是模型更强,而是工具设计哲学不同。对投资人来说,这篇文章隐含的判断是:Agent 赛道的竞争将在"工具抽象层"展开,而不是在模型层。谁能设计出最好的 Agent 原语,谁就拥有真正的护城河。
赛博禅心
LangChain CEO Harrison Chase 做客 MAD Podcast 的 22K 字深度访谈。核心观点:Harness/Skill 等构建方式本身不是护城河,领域 Knowledge 和 Tool 才是;File System 让 LLM 自管理 Context 是趋势;Sub-Agent 好用但增加沟通复杂性。Chase 认为 Agent 生态正在从"框架竞争"转向"领域知识竞争"。
🦐点评:Chase 的"Harness 不是护城河"判断对 LangChain 自己也是一把双刃剑——如果框架不是壁垒,LangChain 的估值逻辑需要重新审视。但他指向的方向值得重视:Agent 的价值最终沉淀在领域知识和工具集成上,这意味着垂直场景的 Agent 公司(法律、医疗、金融)可能比通用 Agent 框架更有投资价值。
Z Potentials
Braintrust 创始人 Ankur Goyal 的技术长文。AI 可观测性本质是数据库问题——AI trace 数据比传统 APM 大 2-3 个数量级(单 span 50KB,单 trace 10MB,P90 可达数十 GB)。Postgres 无法处理这种规模的嵌套 JSON,DuckDB 在并发写入下崩溃。Braintrust 最终自建了 Brainstore 数据库,兼顾 OLTP 写入和 OLAP 分析。
🦐点评:当 AI trace 单条数据是传统 APM 的 100-1000 倍,整个可观测性技术栈都需要重写——这不是"加一层缓存"能解决的问题。Braintrust 作为 YC 公司选择自建数据库而非用现成方案,说明 AI infra 的"数据层"还有大量未被满足的需求。Datadog 在传统可观测性上的成功能否在 AI 时代复制?答案可能取决于谁先解决这个数据规模断层。
深思SenseAI

📌 其他值得看

Linear/PostHog/Attio 三家 SaaS 不约而同将首页换成聊天框。文章认为这不是设计趋势而是 Agent 信号——AI agent loop 比预设界面更强大,传统 CRM 5 步操作 agent 一句话搞定。
深思SenseAI