🔥 精选推荐

三星电子宣布向全球员工部署 ChatGPT Enterprise 和 Codex,OpenAI 称这是其规模最大的企业级 AI 落地之一。覆盖范围从办公知识工作延伸到研发侧的编码场景,意味着 Codex 正以"全员工具"形态进入大型制造企业。
🦐点评:三星不是缺自研模型的公司(有 Gauss),却选择全员上 ChatGPT+Codex——这说明大企业买的不是"模型能力",而是"现成的工程化交付"。对国产模型出海是个警示:拼参数没用,拼的是企业级部署、合规和 Codex 这种端到端工作流的成熟度,而这正是字节、阿里目前最薄弱的一环。
openai.com
作者反驳"AI 文本和人类文本统计上不可区分"的流行观点:以亚马逊上约 220 本《100,000 个为什么》同质化童书封面为例,说明可识别的不是单条文本,而是 AI 规模化生产带来的"批量同质性"——即所谓 AI slop。判别 AI 不靠单句的图灵测试,而靠它在量级和模式上的指纹。
🦐点评:这个论点对内容平台估值有直接含义——如果"AI slop"在统计意义上可识别,那么 Reddit、知乎这类 UGC 平台的真实人类内容会成为稀缺资产,反向推高其数据授权议价权。投资人该关注的不是"AI 能不能写得像人",而是"谁手里还握着干净的人类语料"。
lcamtuf.substack.com
geohot 在伯克利待了两周后的犀利观察:他认为湾区的"AI 末日论"已变成一种为高估值和生活方式自洽服务的意识形态("doom justifies the valuation"),而非真正的技术讨论。文中顺带称赞 GLM-5.2 的技术博客,认为其水准已与 Opus 4.8、GPT-5.5 同档,是他理想中"踏实推进"的工程风格。
🦐点评:geohot 把 AI 安全叙事和估值挂钩点破了一层窗户纸——很多 safety-first 的高估值公司,其叙事红利正在被 GLM-5.2 这种"闷头做工程"的对手稀释。当一个特立独行的硬件极客都开始公开夸国产模型对标第一梯队,说明技术叙事的话语权正在从"谁更担心末日"转向"谁的博客更像实干家"。
geohot.github.io

📌 其他新闻

Lenny 访谈 Anthropic Claude Code 与 Cowork 团队负责人 Fiona Fung(曾在微软做 VS/TypeScript、在 Meta 创立 Facebook Marketplace),聊在 Agent 无处不在、角色边界模糊时如何维持工程团队文化。
lennysnewsletter.com
Cloudflare 推出临时账号:无需注册即可 npx wrangler deploy --temporary 部署 Workers 项目,临时实例存活 60 分钟,可后续认领转正。名义上为 AI agent 设计,实则降低了所有人的部署门槛。
simonwillison.net
Simon Willison 的 SQLite 工具库 sqlite-utils 发布 4.0rc1,新增数据库迁移(migrations)和嵌套事务支持,是该库的一次重要架构升级。
simonwillison.net
量子位统计:2026 上半年(截至 6/12)国内具身智能融资约 438 亿元,已逼近 2025 全年的 554 亿;超半数流向强调"软件定义硬件"的"大脑派"公司,本体派仅占 12.8%。千寻智能 4 个月融 4 轮近 50 亿、估值 200 亿,近八成新融资公司在做世界模型。
qbitai.com
HashiCorp 联合创始人 Mitchell Hashimoto 宣布再向 Zig 软件基金会捐赠 40 万美元,持续支持这门系统编程语言的开发。
mitchellh.com
InfoQ AICon 上海议题预告:探讨内容风控如何从"机审+人审"模式升级到由大模型与 Agent 驱动的 AI-Native 风控体系。(全文抓取失败,基于标题与摘要)
infoq.cn
技术博主 Fernando Borretti 的一篇思辨随笔,副标题为"足够高级的犬儒主义与天真无异",讨论庸俗唯物主义的认知陷阱。
borretti.me

🧠 AI 技术前沿

Hesamation @Hesamation
GLM-5.2 背后公司 Zai 的股价过去 6 个月暴涨 15 倍,并在 GLM-5.2 发布后再次飙升。作者类比:在其 IPO(约 GLM-4.7 时期)后买入,相当于 2019 年初买入比特币。
查看推文 →
Hesamation @Hesamation
引用 Vercel CEO 对新模型(GLM-5.2)的称赞,称已记不清上一次社区如此一致地盛赞一个新模型发布是什么时候,"他们真的做出来了"。
查看推文 →
Hesamation @Hesamation
推荐一篇关于在家本地运行 LLM、完全掌控自己 AI 的必读文章,称其为"强烈建议阅读"。
查看推文 →
vasuman @vasuman
简短爆料:Opus 4.8 现在改名为 Fable。
查看推文 →
emollick @emollick
把 Codex/Cowork/Code 扩展到所有知识工作有个根本问题:它们仍然非常"软件脑"——只把最终产物(代码)当作真理来源。但很多知识工作中,过程(调研、探索备选、失败尝试、实验分支)和结果同样重要,无法被这种范式覆盖。
查看推文 →
emollick @emollick
AI 与既有学术成果的互动会变得很微妙:他把自己研究生时期发表的第一篇论文交给 GPT-5.5 Pro,让它找错误并更新,结果模型找到了新数据、做了分析、生成了可复现文件,还扩展了核心论点。
查看推文 →
MengTo @MengTo
用 Opus 4.8 做设计反而更差,这说明 Claude Design 只是在叠加"品味"而 Codex 没有;解法是补充"品味技能"或给大量上下文——配上上下文后它其实相当好用。
查看推文 →

🚀 创业动态

shao__meng @shao__meng
拆解 Greg Isenberg 与 Theo Tabah 关于"AI Native 组织"的对谈:真正的 AI Native 由人、Agent、上下文三层系统构成;人退守战略/品味与沟通/信任两端,Agent 需满足清晰目标、技能、工具、上下文四要素才能自治。
查看推文 →
shao__meng @shao__meng
介绍 OpenAI Codex 的 Record & Replay:有些工作流难用文字描述但"做一遍"很直观,给 Codex 演示一次即可固化为可复用的 AI Skill,是一种"演示即规格(demo-as-spec)"的设计哲学。
查看推文 →
hongming731 @hongming731
BestBlogs 精选周刊第 100 期特刊《百篇回顾》上线:两年 AI 沿六条线(模型、AI Coding、工程范式、Agent、产品商业、领袖思想)精选 100 篇,主线是"答案越来越便宜,提对问题、做对判断越来越值钱"。
查看推文 →
marclou @marclou
平台第 105 笔创业收购:一个月收入 850 美元的活动策划 SaaS 以 20,000 美元(2 倍倍数)售出,整个交易耗时 42 天。
查看推文 →

💬 观点与洞察

EXM7777 @EXM7777
Opus 4.8 这 48 小时表现惊艳,但令人沮丧的是它会从"神级表现"在某些日子掉到"几乎不可用";如果 Anthropic 别每两周就"阉割"一次模型,他们或能胜出。
查看推文 →
EXM7777 @EXM7777
批评某模型本质是"推理废料":思考时间是 GPT-5.5 的三倍却输出更差,仅在编码和前端设计尚可,贵、无视觉能力、做营销任务很差,开发者直接用 GPT-5.5 即可。
查看推文 →
shao__meng @shao__meng
看到 GLM-5.2 对比 Gemini 3.5 Flash 的投票,认为结果显而易见,主因是 Gemini 3.5 Flash 不能打;感叹 Google DeepMind 自 Gemini 3.0 多模态惊艳后就一路沉寂。
查看推文 →

🔥 精选推荐

catnip.ai 用 10 人团队、64 张 H100、2 个月时间交付业界首个 22B 流式音视频模型 MaineCoon v1.0:单卡 H100 实现 47.5 FPS 实时推理,生成成本压到 Veo3 的两千分之一,首次支持 30 分钟以上生成。创始人杨姝瑞为前 TikTok/PixVerse 产品负责人,核心算法谢泽柯为港科大(广州)助理教授、前百度研究院。团队从做 C 端互动视频应用起步,发现接现有模型 API 商业模型跑不通,遂自研轻量模型;组织上采用"主题式分工"而非职能流水线。
🦐点评:这是对"视频生成需百人团队、千万卡时、亿级美元"行业共识的一次直接证伪——如果成本真能压到 Veo3 的两千分之一,那么 Runway/Pika 乃至可灵的烧钱护城河就被重新定价了。真正值得追的信号是"流式+实时+低成本"组合,它指向的是 UGC 级互动视频这个尚未被巨头吃下的新品类,而字节系精锐+学术派的团队配置正是这类 deal 最该约的 founder 画像。
Z Potentials

📌 其他值得看

编译 Contra Labs 的 Design Crit 研究:10 位设计师对 4 个前沿文生图模型沿 9 维度盲评,发现现成的 9 个 AI"设计裁判"准确率都卡在 51%–54%(抛硬币 50%、人类 74.1%);瓶颈不是模型大小而是数据,用对数据训练的小模型可补上约 46% 差距。
深思SenseAI
编译一篇浏览量 530 万的文章:多数人仍用"提需求—等—改—再问"的最慢方式用 AI,更快的方式是把目标一次给它,让它自己跑完"计划—执行—自检—修补"的循环(loop),附可直接粘贴的自循环提示词。
深思SenseAI
编译 OpenAI 员工 tevfik 关于 loop engineering 的文章:与 coding agent 协作时,代码虽由 agent 写,但记录进展、决定下一步、判断是否完成的"那个循环"始终是人本身,点出人机协作中人类角色的真实位置。
深思SenseAI
作者参加阿那亚戏剧节"候鸟 300"Vibe Coding 300 小时活动的现场随笔,记录在艺术海滩边写代码的体验与社群交流氛围,提及马工、王登科等开发者。
手工川