🔥 精选推荐
DeepSeek 发布 V4 系列两款预览模型:V4-Pro(1.6T 参数,49B 激活)和 V4-Flash(284B 参数,13B 激活),均支持 100 万 token 上下文,MIT 开源。V4-Pro 是目前最大的开源模型,超过 Kimi K2.6(1.1T)和 GLM-5.1(754B)。定价极具冲击力:Flash 输入 $0.14/M、输出 $0.28/M,比 GPT-5.4 Nano 还便宜;Pro 输入 $1.74/M、输出 $3.48/M,在大模型中性价比最高。Simon Willison 测试了 SVG 绘图能力,认为模型质量接近前沿水平。
🦐点评:DeepSeek V4 的定价策略是对整个闭源前沿模型商业模式的结构性挑战——V4-Pro 的输出价格只有 GPT-5.5 的 1/9、Opus 4.7 的 1/7,而性能差距已大幅缩小。对 VC 来说,两个推演值得关注:一是开源模型在 Agent 场景的性价比优势可能加速企业从闭源 API 迁移,挤压 OpenAI/Anthropic 的 API 收入天花板;二是 DeepSeek 声称 V4 对华为昇腾 950 做了适配优化,这意味着中国 AI 算力生态正在形成自洽闭环,对英伟达的出口管制效果需要重新评估。
Simon Willison 推荐 The Verge 主编 Nilay Patel 的深度评论。Patel 提出"software brain"概念——习惯把一切视为可自动化的信息流的思维方式,正在与普通用户脱节。AI 使用数据持续飙升,但公众对 AI 被强行嵌入日常产品的反感也在升温。Patel 指出,普通人并不渴望自动化:Apple、Google、Amazon 花了十多年推广智能家居,大多数人依然不在乎。"Software brain"的极限在于——人类体验不能被压缩进数据库。
🦐点评:这篇文章对当前 AI 投资叙事是一记冷水。如果"AI 渗透率"的增长主要靠企业端强制嵌入而非消费者主动需求拉动,那 to-C AI 产品的留存曲线和付费意愿都需要打折。Patel 的"software brain"框架暗示了一个投资盲区:VC 和创始人自己就是最严重的 software brain 患者,容易高估普通用户对自动化的接受度。真正的 to-C AI 机会可能不在"帮你自动化一切",而在"帮你做那些你确实不想做的事"——区别微妙但关键。
2025 年 1 月,Oracle CEO Larry Ellison 飞赴华盛顿参与 Stargate 项目发布,这是 OpenAI 与 Oracle 合作的 5000 亿美元 AI 基础设施计划。但文章分析了 OpenAI 正在走一条"先合作再取代"的路径——从依赖 Oracle 的数据中心基础设施起步,逐步构建自有算力能力,最终可能不再需要 Oracle 作为中间层。
🦐点评:这篇分析揭示了 AI 基础设施市场的经典"拥抱-延伸-消灭"风险。Oracle 赌的是 OpenAI 需要企业级数据中心运维能力,但 OpenAI 已经在自建能力——$5000 亿 Stargate 计划本身就是 OpenAI 从 Oracle 解耦的路线图。对 Oracle 投资者来说,AI 收入增长的叙事可能只是一个过渡阶段;对 infra 投资人来说,大模型公司垂直整合算力的趋势意味着独立数据中心运营商的议价权正在被侵蚀。
Newcomer 报道 SpaceX IPO 的赌注持续升高。同期,知名 VC Bill Gurley 公开质疑市场普遍接受的"算力短缺"叙事,认为实际供需关系可能比共识更复杂。此外,Disney 前 CEO Bob Iger 加入 Thrive Capital,为这家因 OpenAI 投资而声名鹊起的 VC 增添了更多媒体和消费领域的人脉资源。
🦐点评:Gurley 质疑算力短缺的时间点值得注意——正值英伟达估值接近历史高位、DeepSeek V4 证明训练效率仍有大幅提升空间之际。如果算力供需拐点比市场预期来得更早,英伟达的硬件溢价和一系列算力 infra 创业公司的估值都需要重新校准。Iger 加入 Thrive 则是另一个信号:顶级 VC 正在为 AI 应用层的"好莱坞时刻"做人才储备——光有技术判断力不够,下一阶段需要理解内容和消费者的人。
文章探讨了 AI 对软件工程师职业可持续性的冲击。核心论点:使用 AI 完成任务意味着你无法充分学习该任务本身。部分工程师认为这是反对使用 AI 的决定性论据——但作者认为关键不在于"AI 让你变笨",而在于当 AI 能完成越来越多的编码工作时,通过长期积累经验来成为资深工程师的传统路径可能不再可行。职业生命周期可能从 30-40 年压缩到更短的窗口。
🦐点评:这篇文章指向了一个被 AI 投资热潮掩盖的结构性风险——如果 AI 确实压缩了工程师的职业生命周期,那"开发者工具"赛道的 TAM 天花板需要重新计算。更深层的含义是:当 junior 工程师不再需要通过 5-10 年的手工编码积累成长为 senior 时,企业对人力的需求曲线不是线性下降,而是中间层坍塌。这对 HR tech、upskilling 平台和 coding bootcamp 都是颠覆性的——传统"培训→就业→升职"的价值链正在断裂。
📌 其他新闻
Latent Space 对 GPT 5.5 发布和 OpenAI Codex 定位为"超级应用"的综合分析。GPT 5.5 延续了前沿模型竞赛,而 Codex 正在从代码助手进化为集成浏览器、终端和多工具调度的全功能 Agent 平台。
Hugging Face 官方博客对 DeepSeek-V4 的技术解读,重点分析其 100 万 token 上下文窗口对 Agent 应用的实际意义——不仅是更长的输入,更是让 Agent 在复杂任务中保持连贯性的关键能力升级。
Ben Thompson 周报,覆盖 Tim Cook 时代的终结、Cursor 与 SpaceX 的交集、以及"冷战 2.0"的多条战线。标题暗示对 Cook 执掌 Apple 时代的总结性评价。
a16z 周报数据亮点:Railroad GPT 项目、稳定币交易量从转账向支付场景迁移、新闻行业未来十年展望、以及生产力增长的放缓趋势。
Dwarkesh Patel 设立 AI 博客写作奖,征集关于 AI 大问题的深度文章。他坦言设奖的"不太秘密的目的"是借此找到合适的研究员加入团队——一种用公开竞赛替代传统招聘的人才筛选策略。
36 氪深度分析 DeepSeek V4:1.6T 最大参数、1M 上下文、基于 MoE 和稀疏注意力机制 DSA。文章指出 V4 从 HAI 迁移到华为昇腾做训练是延迟发布的主因,并提出了 V4 商业化路径、开源生态影响等五个尚未回答的关键问题。
AI 内容创作公司"感知阶跃"旗下 Buzzy 完成 2000 万美元融资,ARR 已达 2000 万美元。产品定位为视频编辑 Agent 平台,用户通过自然语言指令驱动视频编辑操作。创始人 Ella Zhang 曾是苹果 AirPods 创始团队核心成员。
🧠 AI 技术前沿
DeepSeek 发布新模型 V4,完全开源权重,基准测试表现优秀。但开源模型的 benchmark 不总能反映实际使用体验,需要上线后实测验证。
查看推文 →
用 DeepSeek V4 Pro 做 TiKZ 画图测试,首次就画出了两只独角兽——TiKZ Sparks 系列测试的标志性难题。使用 DeepSeek 官网的 Expert 模式(即 V4 Pro)。
查看推文 →
DeepSeek 花了 16 个月打磨 V4:1.6T 参数、49B 激活参数、32T token 训练量、全新注意力架构,全部公开可用。特别针对 Agent 任务做了优化,是目前最大的开源模型。
查看推文 →
DeepSeek-V4 使用了 Kimi 的 Muon 优化器配方来扩展 LLM 训练,而 Kimi K2/K2.6 则采用了 DeepSeek-V3 的架构技术(超稀疏 MoE + MLA)。开源 AI 实验室正在相互借鉴、复合增长——这正是开源该有的样子。
查看推文 →
认为 GPT-5.5 和 Opus 4.7 都没有什么特别的——基准测试作为模型评估标准已经正式失效,实际使用体验才是关键。
查看推文 →
用 GPT 5.5 + Codex 创建 Remotion 动态视频的完整教程:从项目搭建、品牌素材组织、Suno 配乐到最终渲染,展示了 Codex 作为视频创作工具链的端到端能力。
查看推文 →
🚀 创业动态
呼吁抓住当下历史性创业窗口:消费移动应用自 2017 年以来首次变得有趣——App 不再是"点击查看"而是"点击执行"。结合 AI + 区块链支付 + 开源无服务器后端,创业门槛前所未有地低。每个垂直行业都有被 AI 重构的机会。
查看推文 →
完全用 vibe coding 开发的战争/无人机模拟器现已上线多人对战模式。从士兵切换到无人机发射,支持无人机对战。使用 Node.js 多人服务器,还加入了 AI 生成的东欧战争风格音乐。这是他参加 #vibejam 的作品。
查看推文 →
发布 discrawl 0.6.0:新增读取 Discord 私信功能,无需自定义登录技巧,不会触发封号。但不支持写入——"给人类发 AI 生成的内容是不礼貌的"。
查看推文 →
一个 $53 MRR 的 AI 创业项目在 trust_mrr 平台上 28 天内被收购。微型 SaaS 的退出市场正在形成。
查看推文 →
上个月靠一个 App 的视频内容获得 100 万播放量,花费 $0、投入仅 10 分钟。同一内容分发到 5 个平台,Facebook 视频的流量表现超预期——跨平台分发的边际成本几乎为零。
查看推文 →
💬 观点与洞察
我们需要一个更好的词来形容"好的 AI 疯狂状态"——那种有人带着最新模型进入恍惚状态、40 天后从山顶归来时带回全新事物的状态。
查看推文 →
Claude 宕机时如果你完全无法工作,说明你已经被绑定了。第一优先级应该是构建模型无关的系统——结构化知识库和可在模型间迁移的工作流。依赖单一供应商对业务非常危险。
查看推文 →
AI 没有取代开发者,它把开发者的薪水替换成了数据中心投资。
查看推文 →
AI 让实干者更高效,让空想者更能说。
查看推文 →
🔥 精选推荐
元戎启行招募 DeepSeek 核心成员阮翀,标志着大模型人才正在加速流入智能驾驶赛道。这批人才带来的不仅是算法能力,更重要的是突破现有智驾技术框架上限的可能性——传统 L2+/L4 方案的架构瓶颈,需要具备大规模预训练和 MoE 架构经验的团队才能破局。
🦐点评:大模型人才流向智驾是一个值得追踪的信号。阮翀从 DeepSeek 到元戎启行的路径说明:顶尖 AI 研究者开始认为智驾是大模型技术落地的高价值场景,而非仅限于 chatbot 和代码生成。对 VC 来说,这意味着智驾赛道可能出现技术范式切换——不再是"更多数据+更多里程"的渐进式改良,而是 Foundation Model 原生架构带来的跨越式提升。关键观察点:元戎能否在华为、小鹏等已有自研大模型智驾方案的玩家中,凭借人才密度杀出差异化。
深度还原 Notion 联合创始人 Ivan Zhao 和 Simon Last 的 AI 转型内幕:公司进入"战时节奏"、推行有机 AI 整合策略,以及一次豪赌式的底层重构。Notion 的路径是在已有产品中自然嵌入 AI 能力,而非推倒重来做一个"AI 原生"新产品。
🦐点评:Notion 是为数不多从"前 GPT 时代"成功过渡到 AI 时代的生产力工具——大多数同期产品要么被 AI 原生产品取代,要么 AI 功能沦为鸡肋。Ivan Zhao 选择"有机整合"而非"推倒重来",本质上是在赌用户习惯的粘性强于技术范式的颠覆力。这个判断目前看是对的:Notion AI 的 DAU 渗透率显著高于独立 AI 笔记应用。但风险在于,当 Agent 能力足够强时,用户的工作流起点可能从"打开 Notion"变成"告诉 Agent 去做"——中间层产品的分发优势会被绕过。
一位 00 后创始人获得阿里战略投资,产品以 AI 客服为切入点,目标是重构电商的底层生产力。AI 客服正在从"自动回复"升级为"自动执行"——不仅回答问题,还能直接完成退换货、改地址、推荐商品等操作。
🦐点评:电商客服是 AI Agent 落地最快的场景之一——SOP 明确、数据闭环完整、ROI 可量化。阿里战略投资一位 00 后创始人本身就是信号:大厂内部做 AI 客服的速度已经不够快,需要外部团队的产品感和执行力来补位。关键问题是:当 AI 客服从"省人力成本"进化到"直接驱动交易转化"时,它就不再是成本中心而是利润中心——这会改变整个客服 SaaS 的定价模型和估值逻辑。
Anthropic 发布详细 postmortem,解释了 Claude Code 持续一个月的性能下降问题。原因是三个完全独立的改动叠加:模型微调调整、上下文处理变更和系统提示更新,每个单独看似无害,叠加后导致了明显的体验降质。这是一次典型的分布式系统故障复盘。
🦐点评:这份 postmortem 对所有做 AI 产品的团队都是教科书级案例——三个"安全的小改动"叠加产生不可预测的降质,暴露了当前 AI 产品质量保证体系的根本脆弱性。对投资人来说,值得追问的是:如果 Anthropic 这种级别的团队都需要一个月才能定位问题,那更早期的 AI 创业公司的质量控制能力如何?AI 产品的"可观测性"基础设施(eval 系统、A/B 测试、回归检测)可能是一个被低估的投资方向。
📌 其他值得看
比起外界期待的"石破天惊"式体验,DeepSeek 更愿意把重心扎在架构与工程上。V4 的技术路线选择(DSA 稀疏注意力、华为昇腾适配)反映了长期主义取向。
GPT-5.5 发布,ARC-AGI-2 达到 85%,OpenAI 内部 85% 的工作已在 Codex 上运行。OpenAI 正在从"更强的模型"转向"更强的系统"。
Era 完成 1100 万美元融资,支持 130+ 种 LLM 和 14 家供应商的智能编排,定位为 AI 硬件时代的软件基础设施层。
Cerebras 用十年做出比英伟达 H100 大 57 倍的晶圆级芯片,拿到 OpenAI 百亿合同,即将纳斯达克上市。是 AI 芯片赛道除英伟达外最重要的 IPO 标的。
晚点梳理九个行业的涨价现象——"所有数字都在涨,除了消费力"。宏观消费环境的压力对 to-C 产品定价策略和市场规模预期有直接影响。
Anthropic Claude Code 产品负责人 Cat Wu 在 Lenny's Podcast 分享 AI 时代 PM 角色的剧变:一天出一个功能的速度文化、源代码泄露善后,以及封堵 OpenClaw 引发的开源争议。