🔥 精选推荐

Anthropic 于 6 月 30 日解除对 Fable 5 与 Mythos 5 的出口管制,Fable 5 于 7 月 1 日面向全球恢复(Pro/Max/Team 及部分企业版每周 50% 用量额度用到 7 月 7 日)。触发管制的是亚马逊研究员发现的一个绕过 Fable 5 防护的方法——诱导模型识别软件漏洞、并在一例中生成利用代码;但 Anthropic 测试表明 Opus 4.8、GPT-5.5、Kimi K2.7 等更弱的模型也能识别同样漏洞,属"边界情形"。作为回应,公司训练了新分类器,可拦截该技术 99% 以上,代价是日常编码/调试的误报率上升,被拦请求会转由 Opus 4.8 处理。Anthropic 还联合亚马逊、微软、谷歌等 Glasswing 伙伴起草了一套"越狱严重性"四维评分框架(能力增量、能力广度、武器化难度、可获得性),并承诺向美国政府提供前沿模型的预发布访问与联合评测。
🦐点评:真正的信号是前沿模型的发布权正从企业单方转向"企业+政府"共同治理——对"实质推进国家安全相关能力"的模型给政府预发布访问、加上 24/7 越狱监控和行业越狱评分标准,等于把"合规能力"做成一道只有头部实验室付得起的新护城河,初创短期内无法复制。反过来看,"benign 请求误报率上升、被转 Opus 4.8"意味着 Fable 5 的实际可用性打了折扣,KOL 已在骂"不是被削弱是被屠杀"——为安全牺牲可用性,正在给没有同等管制包袱的 GLM-5.2/Kimi 这些开源模型让出编码场景的缝隙。
anthropic.com
Pragmatic Engineer 的 Gergely Orosz 深度报道 Meta 工程组织的自毁:4 月起产品团队被自上而下要求把 30-50% 工程师(约 4500-6500 人进入 ADO 数据标注组)调去为 Meta 自研编程大模型做数据标注和 RLHF,同时强制记录键鼠操作作为训练数据、把 token 用量纳入绩效,催生"tokenmaxxing"。恶果接踵:5 月 30 日 Instagram 出现"零认证改密码"漏洞(含奥巴马白宫账号被接管),信任与安全团队因抽调和裁员减员约 50%,次日 CISO Guy Rosen 离职;interviewing.io 数据显示 Meta 员工求职量 5 月激增。作者把根源指向扎克伯格与 Alexandr Wang——除裁员外,一切都照搬 Scale AI 打法。
🦐点评:Meta 亲手把工程从"利润中心"降级为"成本中心",最大的二阶效应不是这次宕机,而是人才外溢——最好的基础设施/安全工程师正在集中离场,这恰恰是 Anthropic 等对手加速挖角的供给面。对 VC 有两点可操作:一是紧盯承接这波 Meta 出走者的 infra/security 初创;二是"tokenmaxxing"暴露了一个反向指标——当大厂把 token 消耗当 KPI,token 增长数据的含金量在稀释,别把云厂商/模型公司的 token 增长直接读成真实需求。
pragmaticengineer.com
Newcomer 盘点这个夏天 AI 投资的"泡沫焦虑与 FOMO 并存":国际清算银行(BIS)在升级泡沫预警,杠杆 ETF 保证金交易升温,《华尔街日报》称强劲财报被"注水"。连长期唱多的人也开始不安——Founders Fund 的 Trae Stephens 说"这让我非常想起 2021 年",Palantir 的 Alex Karp 在 CNBC 抨击企业客户对 AI 成本和基础模型公司的做法极度愤怒、很快会有所行动。但 FOMO 依旧压倒一切("错过 AI 就像连整个联赛都缺席")。本周交易面:neocloud 公司 Together AI 完成 8 亿美元 C 轮、估值 83 亿美元,OpenAI 拟给美国政府 5% 股份,Meta 加入 xAI 行列对外卖算力,德国无人机公司 Quantum Systems 大额融资。
🦐点评:真正的信号不是"要不要担心泡沫",而是 Karp 点出的"企业客户对 AI 成本已经愤怒"——这是需求侧第一次出现结构性反弹,而非供给侧的估值争论。如果一线大客户开始压价、或把工作负载从最贵的前沿模型迁到便宜模型(呼应今天 GLM-5.2 抢编码场景),最先受伤的恰恰是估值最依赖"用量无限增长"叙事的模型公司和 neocloud。可操作:Together AI 83 亿估值这类 neocloud 的下注逻辑,得从"算力永远紧缺"切换到"客户对单位推理成本的敏感度"——后者一旦上升,重资产的 neocloud 比轻资产的编排层更脆弱。
newcomer.co
Adobe 首席科学家 Carlos Sanchez 在 AIEWF 演示"agentic site"——网站根据访客实时意图动态组装页面,Adobe 称之为"audience of one"(一个人的受众)。系统把浏览行为归入"浏览/研究/准备购买"等意图类别,再用 LLM 从企业现有内容里检索并实时拼装页面(如给一个露营者组装一个"户外做咖啡"版本的咖啡机页面)。关键约束是延迟(要求页面生成不超过 1-2 秒)和成本(当前约每页 1-2 美分推理成本,且"只会更便宜")。Sanchez 坦言最大难点不是能不能做,而是"很容易造,但很难知道该造什么",且生成内容可能偏离品牌规范。文中还引出 WebMCP、A2A 等让网站同时服务"人类访客"和"agent 访客"的技术路线。
🦐点评:"每页 1-2 美分、1-2 秒生成"是这条赛道从 demo 走向可算账的门槛数字——一旦转化率提升能覆盖每页几美分的推理成本,个性化网页就有了 ROI 模型,这是电商/营销 SaaS 会被重写的信号。对投资人:真正的价值不在"生成页面"本身(LLM 已白菜化),而在两层——一是把企业存量内容变成可检索 grounding 语料的中间层,二是同时向人和 agent 暴露结构化工具的 WebMCP/A2A 协议层。Adobe 都还没规模化部署,说明这是个卡位窗口;谁定义了"agent 可读的网站"标准,谁就拿到下一代 web 的入口。
latent.space
AIEWF 第三天的信号密度很高。资本面:Together AI 宣布 8 亿美元 C 轮、估值 83 亿美元。开源模型面:智谱 GLM-5.2 成为首个在 APEX-SWE 某类目(Integration,55.3% Pass@1)登顶的开源模型、Kimi K2.7 紧随,Z.ai 还围绕 GLM-5.2 推出官方开发环境 ZCode。企业 Agent 架构面:Cognition 的 Devin Security Swarm 用"Agentic MapReduce"在代码库里扇出有界 agent、聚合并验证漏洞可利用性,某财富 500 强试点已发现并修复上千个生产漏洞;"wiki 记忆"成为 agent 记忆的实践范式,LangChain 发布 OpenWiki。系统层:NVIDIA 的 Nemotron-TwoTower 用双塔改造把 30B 模型生成速度提升 2.42 倍、保留 98.7% 质量。
🦐点评:最该圈出来的是 Cognition 那句"某财富 500 强试点修复上千个生产漏洞"——这是 agent 从"辅助写代码"跨到"承包一整条企业安全工作流"的第一个可量化战果,Agentic MapReduce(扇出-验证-聚合)很可能像 MapReduce 之于大数据一样成为 agent 工程的通用范式。对投资人有两条线:一是开源编码模型(GLM-5.2/Kimi K2.7)正在单点超越,验证了"模型-IDE-分发"垂直整合(ZCode)的打法;二是"agent 记忆/知识层"(OpenWiki、Weaviate Engram)正从检索升级到"对账与维护",这层基础设施还没有赢家,是比模型层更早期的下注点。
latent.space

📌 其他新闻

AIEWF 第三天出现对"软件工厂"叙事的集体反弹——Introspection 主张用 autoresearch"外循环"让 agent 维护系统本身,但前 Google 工程负责人 Addy Osmani、Notion 的 Geoffrey Litt、Impeccable 的 Paul Bakaus 都强调"外循环必须留给人类",Litt 更直言"委托理解的人终将被 agent 取代"。
latent.space
苹果 WebKit 在 Safari 技术预览版 247 推出 Safari MCP Server,让 Claude Code、Codex 等 agent 直接连上 Safari 窗口读取 DOM、网络请求、控制台和截图来自主调试,且完全本地运行、不联网——苹果正式把浏览器接入 agent 工作流。
webkit.org
证监会同意宇树科技科创板 IPO 注册,人形机器人龙头即将登陆 A 股;同日 A 股半导体、算力硬件、存储板块大跌,业内称"Meta 带崩科技股、算力过剩"实为误读。
36kr
Claude Sonnet 5 上线一天即遭差评刷屏——被指跑分打不过阿里千问和 MiniMax,且换新分词器后同样内容切出更多 token,性价比全面翻车。
雷锋网
昆仑万维天工 AI 业务 ARR 突破 8 亿美元(其中 AI 短剧平台业务超 7 亿),冲刺中国首个非 BAT 的 10 亿美元 ARR AI 公司。
量子位
Meta 被讥"退出 AI 竞赛"后转向对外出售算力,股价单日暴涨 10%——市场用脚投票认可"卖铲子比淘金更赚"的路径。
infoq.cn
对比 Claude、Manus 仍需人工搭框架,小米提出让 Agent 自我进化的方案,试图在 agent 自主化上走得更远。
雷锋网
面向"自演进智能体"的强化学习基础设施 AReaL 2.0 开源,主打让 agent 越用越强、与社区共同推进自演进智能体生态。
量子位

🧠 AI 技术前沿

Hesamation @Hesamation
OpenAI 已发布自研 AI 芯片 Jalapeño、Anthropic 也在加紧自研芯片;他预期大模型竞赛正演变为 AI 芯片竞赛(配图取自 Dario 一月的文章《技术的青春期》)。
查看推文 →
emollick @emollick
有关 Mythos 与网络安全能力的说法并非炒作——凡是用 Fable 做自主任务的人多半已经意识到这一点。
查看推文 →
emollick @emollick
他让 Fable 用 Unity+MCP"做一个 FPS 的独特变体、要让玩家惊呼巧妙",模型在零素材、图形全靠程序化生成的条件下做出了可玩的 WebGL 游戏。
查看推文 →
emollick @emollick
持续学习(continual learning)或是 AI 爆发式普及的最大障碍——只要模型仍然健忘、要靠人类替它学习,普及就会被人类流程卡住,这对递归自我改进也影响重大。
查看推文 →
EXM7777 @EXM7777
一项新研究里,一个连单个问题都答不出的小模型同时打赢了 ChatGPT、Gemini 和 Claude——做法是训练一个能在笔记本上跑的小模型专职当"经理"来调度,而非把一切丢给单一最强模型。
查看推文 →
karminski3 @karminski3
分享一个可本地部署的小模型"角色扮演写作"评测(旗舰模型当评委、多次运行抹平随机):Gemma4-31B 居首、Qwen3.6-27B 第二,但这些小模型普遍写不好角色的内心独白。
查看推文 →
shao__meng @shao__meng
拆解组织内嵌式 AI(Claude Tag、Glean):从"每人一个 AI"转向"每个频道一个共享 agent",难点是搭建跨 Jira/GitHub/Slack、带权限、实时更新的组织上下文层,并提出生产级 agent 四支柱——身份、记忆、主动性、可问责。
查看推文 →
Hesamation @Hesamation
吐槽 Fable 5"不是被削弱,是被屠杀"——问题不在模型本身,而在 Anthropic 设下的硬性护栏。
查看推文 →
Hesamation @Hesamation
爆料 Fable 5 很可能会被纳入订阅套餐提供。
查看推文 →
MengTo @MengTo
感叹 Fable 5 做落地页非常强,用简单提示词就能很好地理解 WebGL、滚动行为和文字动画。
查看推文 →

🚀 创业动态

EXM7777 @EXM7777
号召"砸钱买 Claude Max、不惜借债"——他自己叠了 5 个订阅还烧着 4 个 Codex 额度,理由是 Fable 5 曾因出口管制下架数周、这次只开放到 7 月 7 日且封顶周额度 50%,所以要趁窗口猛花 token。
查看推文 →
shao__meng @shao__meng
推介 browser_use 团队开源的视频剪辑 Skill「video-use」:让 LLM 不"看"视频而"读"视频——先用逐词时间戳把音频转写成文本,仅在决策点按需生成时间线视图,再调 ffmpeg 完成剪辑。
查看推文 →
shao__meng @shao__meng
推介设计工程师 emilkowalski(Sonner/Vaul 作者)沉淀的一套 UI/动画品味 Skills,让 Codex、Claude Code、Cursor 写界面和动效时具备接近资深设计工程师的审美判断。
查看推文 →
0xROAS @0xROAS
晒出又一支"爆款"AI 广告风格(Sims 4 风),强调要跳出常规找到能让你脱颖而出的格式,且自己的视频全自动生成、不必手动制作。
查看推文 →
egeberkina @egeberkina
用 GPT Image 2 与 Kling 3.0 Omni 在 Adobe Firefly 里把一个想法做到极致并展示成品(注明为 Adobe Firefly 大使的赞助内容)。
查看推文 →
bcherny @bcherny
Claude Code 里的 Artifacts 功能"改变了工作方式",宣布即将扩展到 Pro 和 Max 用户。
查看推文 →

💬 观点与洞察

emollick @emollick
X 上关于 AI 落地的建议分成两派——"感受到指数增长"的人,与(可能无意识地)默认 AI 就到此为止、于是围绕今天的能力和成本结构去搭产品的人。
查看推文 →
eptwts @eptwts
反驳"套壳=骗局":只要能提供好的用户体验就有权加价,愿意用你界面的人会乐意付费,看不出问题在哪。
查看推文 →
rileybrown @rileybrown
若有人能掀翻 Slack,靠的会是让"在不同模型间切换"更容易,而不是把所有人锁进单一厂商的模型。
查看推文 →
rileybrown @rileybrown
目标不是烧 token,而是把事情做成——只不过把事做成的最好方式恰好就是烧 token。
查看推文 →
levelsio @levelsio
别人劝他"少抱怨、专心做独立开发",但他认为 X 影响力很大、制定政策的人真的会读,帖子火了就能推动改变——你完全可以靠发帖把社会变得更好。
查看推文 →
Hesamation @Hesamation
一句戳心的观察——"结果发现,人类其实比 AI 更便宜"。
查看推文 →
hongming731 @hongming731
BestBlogs 07-03 早报聚焦 Agent Protocol、Loop Engineering、Autoresearch 等主题:其中一篇用 Thread/Run/Step 等 6 个稳定对象、以协议视角拆解 Agent Runtime,指出状态持久化是区分玩具与生产的分水岭。
查看推文 →
corbin_braun @corbin_braun
讽刺政府不想让普通人用上强大 AI——"能出什么问题呢",呼应 Fable 5 出口管制争议。
查看推文 →

🔥 精选推荐

英伟达的 AI 芯片挑战者 Etched"走出隐身",宣布已拿到 10 亿美元合同订单(内容是芯片+定制机架+软件的"前沿推理集群"),累计融资 8 亿美元、投后估值 50 亿美元(含去年 12 月未公开的 5 亿美元、Stripes 领投)。公司 2022 年由两名哈佛退学生创立,赌的是"AI 终将需要专用推理芯片而非通用 GPU",早期几乎无人问津、一度按月续命。如今股东名单堪称豪华:Karpathy、Hinton、李飞飞、Arthur Mensch、Druckenmiller、Thiel 等。同期 Cerebras 完成 IPO、Groq 融 6.5 亿美元、OpenAI 也宣布首款 Broadcom 定制芯片。
🦐点评:Etched 的估值/收入比很极端(50 亿估值 vs 10 亿"订单"、首款产品还在测试),说明市场给推理专用芯片定价的是"推理是最大成本中心"这个叙事而非已验证的产能。真正的分水岭是它把产品定义成"集群"(芯片+机架+软件)而非卖裸芯片——这直接对标英伟达的系统级打法,也意味着退出路径更可能是被超大厂并购而非独立走量。对投资人:ASIC 推理这条线(Etched/Groq/Cerebras)正从"技术叙事"进入"拿单验证",下一个要盯的硬指标不是估值,而是这 10 亿订单里有多少能转成可复购的集群交付——毕竟三大云厂加 OpenAI 都在自研芯片,留给独立玩家的窗口在收窄。
Z Potentials
施耐德电气同意以 31 亿美元全现金收购工业 AI 公司 Cognite(总部亚利桑那、800+ 员工、去年营收超 1.7 亿美元),并将其并入旗下工业软件业务 Aveva(核心产品是"数字孪生")。卖方 Aker 现金收益约 14.8 亿美元。背景是欧洲制造业生产率承压——BCG 报告称西欧北欧约有 1 万亿美元制造价值面临外迁风险,工业 AI 被视为弥合差距的关键,西门子等也在加码。分析师对价格有异议(约 18 倍市销率),施耐德股价一度跌 2.9%。
🦐点评:这笔交易的信号是"工业 AI 的价值正被传统工业巨头而非纯软件公司收走"——欧洲在消费级 AI 已落后,但握着百年工业体系沉淀的专有生产数据,这是通用大模型拿不到的护城河,约 18 倍 PS 说明战略买家愿为"数据+行业 know-how+存量客户"付溢价。对投资人:垂直工业 AI 初创最现实的退出不是 IPO,而是被施耐德/西门子这类既有能源、又有数据中心冷却和车间自动化的巨头整合;判断这类标的要看它的数据资产是否独家、是否已嵌入客户产线(Cognite 恰以"打通孤立数据"起家),而非模型多先进。
Z Potentials
周二晚一场由 AI 实时"导演"的直播交出亮眼数据:主播女流66、壮壮、YJJ 走进 AI 搭建的"现实游戏世界"闯关,AI 事先扫描三人多年直播内容、把名场面重组成"专属副本";1 小时 20 分内总曝光 93.5 万、平均在线 2.3 万(近 7 场均值的 4.6 倍),送礼人数约 7 倍、直播收入约 8.12 万元/小时。关键创新是把观众变成"第四位玩家"——拆炸弹环节让主播"装聋作瞎"、观众靠弹幕当唯一通讯员,打赏排名靠前的粉丝头像被 AI 印进游戏道具。幕后公司"大千"(贝果)股东包括蓝驰、创新工场、明势、光合等,直播中已有商家上门谈把商品融进内容。
🦐点评:这是"AIGC-Native 互动内容"第一次给出可算账的商业化数据——送礼人数 7 倍、单小时 8 万收入,把"AI 提效内容生产"升级成"AI 重新分配互动权力",观众从围观者变成付费参与者。对投资人:真正被重估的是打赏/广告的载体形态——当礼物变成"剧情道具+身份凭证"、品牌能变成游戏里一件道具,直播电商的植入逻辑会被改写。但要警惕两点:一是这是一次性重投入实验(团队自认信息密度过载、要拆成高频短内容),可复制性和边际成本还没验证;二是它高度依赖头部主播的存量内容语料,长尾主播能否复用是这门生意能否规模化的分水岭。
Z Potentials
USV 的 Michael Mignano(投过 Granola、Suno、xAI)把 VC 决策拆成三种"你愿意先相信什么":赌人(信判断力,团队无论做什么都能成,如投 Granola 时啥都没有)、赌地图(信你对某个市场的模型,见遍该方向所有团队挑最好的)、赌势头(信已经发生的事实,纯看数据下注)。文章更狠的一刀在评论区:投资人 Rob Go 指出,过去 VC 多是"对一个未来一以贯之地下注",如今不确定性太高,开始"同时押注好几个互相矛盾的未来";Mignano 也承认 USV 必须同时持有多个 thesis 来对冲"单一 thesis 押错就赔光整个品类"的风险。
🦐点评:作者点破的反直觉是:当不确定性足够高,"有信念"本身会从优势变成风险——"要有 theory of the game"和"别把身家压在一个 theory 上"必须同时成立,这对有鲜明 thesis 传统的机构是直接的方法论拷问。还有一层幸存者偏差值得内部自省:三种打法都是拿"赢了的案例"(Granola、Suno)事后命名成的"流派",同样打法的失败案例没人拿出来命名——别把"某某打法很牛"当因果,它可能只是结果的叙事化。可操作:在高速变化的 AI 赛道里,组合式下注加快速证伪,比"看准一个未来"更像这个时代的基本功。
深思SenseAI
一篇半戏谑半正经的长文点评阿里 AI:模型很能打(Qwen 3.7 Max 达 Opus 4.7 水平、稳居"国模第二",显著领先字节 Seed 2.1 Pro),股价却跌破发行价、市场把它当"老登公司"。文章梳理阿里正在把 AI 业务大整合——成立 Token 事业群(ATH)下辖 Token Foundry(Qwen/Wan 等模型)、MaaS、千问 APP、悟空等事业部,目标是"一家公司、一个模型、一个产品"的「阿里-Qwen-千问」三轴心。核心痛点:千问 APP 推出太晚(豆包 23 年就干、25 年底才上),且执着于跨 App 的 Agent 能力(帮你点奶茶订餐),但"Chatbot 是一阶、Agent 是二阶,漏斗可能筛掉 90% 的人",一阶还没补全就想靠二阶弯道超车。对比智谱 GLM-5.2 打穿编程场景、市值破万亿港元(约半个阿里),作者认为 2C AI 不挣钱、唯一被验证的挣钱路径是"卷编程、面向生产力"。
🦐点评:这篇最值钱的判断是"模型能力→生产力 Agent 是自然结果,而 2C 应用是伪命题"——用智谱(收入不重要、只要 GLM 追上 Opus 4.8 就值半个阿里)和 Seedance(模型够强自然有分销商自费补贴冲量)两个案例佐证。对投资人:一是重估 Qwen 的关键不是"国模第二",而是它像 GLM 一样舍弃多模态、专注编程/长程任务后能否真正"打穿一个点"破圈——在赢家通吃的市场里,差"一点点"就是差全部;二是阿里"外卖 vs AI"的路线之争值得当组织信号跟踪,林俊旸出走、频繁重组本身就说明战略尚未收敛。
葬AI

📌 其他值得看

Fable 5 已可在 Claude 使用——Pro/Max/Team 及高级企业版每周 50% 额度可用、7 月 7 日后改按使用积分计费;API 定价每百万输入/输出 token 为 10/50 美元,是 Opus 4.8 的两倍。
赛博禅心
藏师傅开源的社交卡片 Skill(guizang-social-card-skill)重磅更新,新增 Live Photo 生成与编辑——可把产品录屏、网页 Demo、游戏片段做成小红书/公众号可用的动态卡片,并补齐首帧检查、平台时长、发布路径等落地环节。 <!-- ai-daily:complete -->
歸藏的AI工具箱