收听音频版
下载 MP3

每日简报 | 2026年2月21日


执行摘要

AI行业继续在技术突破与商业泡沫之间剧烈摇摆——硬件初创公司Taalas实现17,000 tokens/秒的惊人推理速度,Anthropic发布Sonnet 4.6,但深度批评文章揭示了AI公司烧钱速度远超营收的残酷现实。与此同时,一篇关于开源项目"鲸落"生态的长文引发广泛讨论,揭示了技术生态系统中被忽视的演化规律。制造业方面,中国电动车的垂直整合优势被详细拆解,美国芯片制造投资持续扩大。


主要报道

AI军备竞赛:速度、成本与泡沫的三重奏

推理速度进入万级时代

加拿大硬件初创公司Taalas发布了其首款产品——基于定制硬件的Llama 3.1 8B实现,达到了17,000 tokens/秒的惊人速度。该公司采用"激进量化"策略,结合3位和6位参数。与此同时,OpenAI宣布GPT-5.3-Codex-Spark速度提升30%,达到1,200 tokens/秒。两相对比,专用硬件在小模型推理上的优势令人瞩目。

为什么重要: 推理速度的竞争正在从纯软件优化转向软硬件协同,这可能催生一个全新的AI芯片创业生态。

来源:Taalas / OpenAI Codex

Anthropic: 光环与阴影

Anthropic本周发布Claude Sonnet 4.6,声称性能接近此前的Opus 4.5,但价格仅为其三分之一($3/$15 vs $5/$25 每百万tokens)。SWE-bench最新独立评测显示,Claude Opus 4.5仍居榜首,紧随其后的是Gemini 3 Flash和中国的MiniMax M2.5。

然而,Ed Zitron的深度批评文章对Anthropic进行了迄今最系统的拆解:

  • 2025年营收45亿美元,亏损52亿美元
  • 推理成本占营收59%(27.9亿美元)
  • CEO Dario Amodei被指控通过模糊时间线("2-3年"、"2025或2026或2027")系统性操纵媒体与投资者
  • Amodei提出的"单模型盈利"概念被批评为类似WeWork的"社区调整EBITDA"——用创造性会计掩盖亏损
  • Claude Code被估计每产生1美元收入需烧掉3-20美元

为什么重要: AI行业正处于一个微妙的转折点——技术确实在进步,但商业模式的可持续性仍是巨大问号。Anthropic未来四年计划投入1000亿美元用于训练,同时已签署数百亿美元的云计算承诺。

来源:Sonnet 4.6发布 / SWE-bench评测 / Anthropic批评


"鲸落":开源生态的生死循环

Andrew Nesbitt的长文以一个绝妙的隐喻——"鲸落"(whale fall)——描绘了大型开源项目消亡后的生态演替:

  1. 食腐阶段:项目停止维护后,分叉迅速出现(OpenOffice→LibreOffice,MySQL→MariaDB)
  2. 富集阶段:较小的项目开始提取特定模块或构建兼容工具
  3. 化能合成阶段:协议、文件格式和API契约持续支撑专业社区数十年(Docker的OCI规范、Atom的Tree-sitter)

文章特别指出了许可证变更引发的快速食腐现象(Redis→Valkey,Terraform→OpenTofu),以及逐代再殖民的危险模式——Rust的tar-rs库中的安全漏洞通过层层分叉传播到20多个项目。

最发人深省的观察:当云厂商收购或维护所有大型项目时,"鲸落率"降低,小型专业生态将失去进化机会。

为什么重要: 这篇文章提供了理解技术生态系统演化的全新框架,对技术选型、安全审计和开源治理都有深远启示。

来源:Whale Fall


制造业与供应链重构

中国电动车的真正优势:垂直整合

Rhodium Group的分析揭示了一个违反直觉的结论——中国电动车的价格优势既不来自低劳动力成本(实际劳动生产率低于西方),也不主要来自补贴,而是来自极致的垂直整合。比亚迪和零跑是这方面的异类,这解释了为何它们能在2024-2025年持续引领降价。

同时,围绕中国汽车的博弈仍在继续——福特与特朗普政府讨论通过合资方式在美国设立中国汽车工厂。

AI对芯片供应链的吞噬效应

三条相互关联的消息勾勒出一幅令人震撼的图景:

  • 美国从台湾的进口额已超过中国,主要由数据中心芯片驱动
  • Micron在美国投资超过1500亿美元建设内存工厂(博伊西500亿+锡拉丘兹1000亿)
  • TSMC计划在亚利桑那再建4座工厂,投资1000亿美元
  • 如果NVIDIA Vera Rubin芯片出货数千万颗,每颗需要20TB+ SSD,将消耗去年全球NAND产能的20%

为什么重要: AI正在从根本上重塑全球半导体供应链。一位评论者用Bostrom的"回形针最大化器"类比——AI对NAND的需求可能"永远不会停止"。

来源:Construction Physics / AI is a NAND Maximiser


Markdown的意外崛起

Cloudflare、Vercel、Laravel Cloud在短短数周内相继宣布"Markdown for Agents"支持。核心逻辑很简单:一篇典型博客文章的HTML/CSS/JS约500KB,转为Markdown仅2KB——减少99.6%

这不仅仅是为AI服务。这实际上是帮助网站所有者避免被AI爬虫DDoS的防御措施。Tedium的分析进一步指出,Markdown可能成为"新的RSS"——通过AT Protocol(Bluesky使用的协议),长文内容发现问题可能得到解决。

WordPress创始人Matt Mullenweg也在推动将此功能加入WordPress.org。

为什么重要: AI驱动的流量正在摧毁许多网站的服务器,Markdown作为轻量级替代层的出现,可能深刻改变网络内容的分发方式。

来源:Markdown's Moment


快讯

  • ggml.ai加入Hugging Face,两大本地AI基础设施团队合并,承诺实现llama.cpp与Transformers库的"一键集成"。这对本地模型生态是重大利好。来源

  • Gemini 3.1 Pro发布,价格不到Claude Opus 4.6的一半,基准测试成绩相近。SVG生成能力显著提升。但发布当天推理极慢,简单"hi"需要104秒响应。来源

  • Ladybird浏览器放弃Swift,2024年8月宣布采用Swift作为内存安全语言,现在承认"长期没有进展"并从代码库中移除。来源

  • Pebble智能手表复活进展:Pebble Time 2将于3月9日开始量产,首批预计4月到达用户手腕;Index 01智能戒指也在PVT阶段。防水等级达3ATM。来源

  • 美国疫苗制造商陷入困境:受RFK反疫苗政策影响,疫苗销售下降,裁员增加,新疫苗投资被削减。更大的担忧是特朗普政府可能取消疫苗制造商的特殊责任保护。来源

  • 美国EV投资出现首次净减少:超过200亿美元此前宣布的EV和电池设施投资在去年被核销。Stellantis以100美元出售其在加拿大电池工厂的股份。来源


值得关注

"Claw"成为AI新范式术语

Andrej Karpathy使用"Claw"来描述一个新兴的AI系统层级——运行在个人硬件上、通过消息协议通信、可以直接执行指令和调度任务的AI代理系统。OpenClaw的出现催生了NanoClaw、zeroclaw、ironclaw、picoclaw等一系列项目。Karpathy认为"Claw"是继"vibe coding"和"agentic engineering"之后的又一个即将广泛传播的术语。来源

AI功能过载的"Cruft临界点"

JA Westenberg提出了一个精准概念:Cruft Threshold——当管理、评估和忽略新工具的成本超过任何单个工具带来的收益时的临界点。"我们大概在第14个应用添加'AI总结'按钮时就已经跨过了这个门槛。"每个公司都有增长团队,没有公司有"减法团队"。来源

巴西的"穿孔公司面纱"

Cory Doctorow介绍了巴西自1937年以来实行的有限责任限制制度——母公司需对子公司的义务承担连带责任。这一制度已运行近一个世纪,并未损害资本形成,反而孕育了多家全球性企业。葡萄牙、委内瑞拉、智利等国已采纳类似制度。这对"资本主义现实主义"——即认为当前经济安排不可替代的信条——构成了有力挑战。来源

开源的中世纪行会化

面对AI生成的垃圾PR泛滥,JA Westenberg提出开源社区需要类似中世纪行会的信任机制——现有可信贡献者为新人担保,担保的权重与自身声望成正比,如果所担保的人是垃圾制造者,担保人也将付出代价。类似Debian的Web of Trust模型已经证明了这种方法的可行性。来源

"AWS for Everything"——柔性自动化的规模化未来

Construction Physics探讨了一个引人入胜的趋势:随着AI和自动化技术的进步,高度灵活的大规模生产设施可能出现——像AWS之于计算那样,为制造业提供按需、多品种、小批量的"云工厂"服务。SendCutSend(年收入突破1亿美元)就是这种模式的早期范例。来源

PODCAST SCRIPT

大家好,欢迎来到2026年2月21日的 YOMOO 每日AI快送。

我跟你说,今天这期内容信息量巨大,我们要聊的东西从AI芯片一路聊到鲸鱼尸体,你没听错,鲸鱼尸体。但我们先从一个让人瞠目结舌的数字开始。

一万七千。一秒钟,一万七千个tokens。加拿大一家叫Taalas的硬件创业公司,用定制芯片跑Llama 3.1 8B模型,直接把推理速度拉到了17000 tokens每秒。什么概念呢?OpenAI前两天刚发布的GPT-5.3 Codex Spark,号称速度提升了30%,达到了1200 tokens每秒。一千二对一万七,差了十几倍。当然,人家跑的模型大小不一样,不能简单横向比,但这个数字本身说明一件事——专用硬件在特定场景下的威力,远超我们的想象。推理速度的军备竞赛,已经从软件优化进入到了软硬件协同的新阶段。

说到军备竞赛,就不得不提Anthropic了。这周他们发布了Claude Sonnet 4.6,声称性能接近之前的Opus 4.5,但价格只有三分之一。听起来不错对吧?SWE-bench最新的独立评测也显示,Claude Opus 4.5还是稳坐榜首,后面跟着Gemini 3 Flash和中国的MiniMax M2.5。技术层面确实在进步。

但是,注意这个但是。

Ed Zitron写了一篇迄今为止对Anthropic最系统的批评文章,里面的数字简直让人倒吸凉气。2025年,Anthropic营收45亿美元,亏损52亿美元。你看清楚了,赚45亿,亏52亿,光是推理成本就花掉了将近28亿,占营收的59%。更狠的是,他估算Claude Code每产生1美元收入,背后要烧掉3到20美元。你想想看,这就好比你开了一家奶茶店,每卖出一杯8块钱的奶茶,你的成本是24到160块。这谁受得了?

文章还特别点了Anthropic CEO Dario Amodei,说他反复用"2到3年""2025或2026或2027"这种模糊时间线来安抚投资者和媒体。而他提出的所谓"单模型盈利"概念,被比作当年WeWork搞的那个"社区调整EBITDA"——本质上就是用创造性的会计手法来掩盖亏损。与此同时,Anthropic未来四年计划砸一千亿美元用于训练,还签了数百亿美元的云计算合同。这到底是在建设未来,还是在豪赌?老实说,我觉得这个问题现在谁也回答不了。AI行业就处在这么一个微妙的转折点上——技术确实在飞速进步,但商业模式到底能不能跑通,依然是一个巨大的问号。

顺便说一句,Gemini 3.1 Pro也发布了,价格不到Claude Opus 4.6的一半,基准测试成绩还差不多。不过发布当天闹了个笑话,你跟它说一句"hi",它要104秒才能回你。一分多钟回一个hi,这体验确实有点感人。

好,咱们换个完全不同的话题。接下来要聊的东西特别有意思,是一篇关于开源项目生态的长文,作者Andrew Nesbitt用了一个绝妙的比喻——鲸落。

什么是鲸落?就是深海里,当一头巨鲸死亡沉入海底,它的尸体会成为一个完整的生态系统,养活周围的生物长达数十年。开源世界里也有一模一样的现象。当一个大型开源项目停止维护或者"死掉"之后,围绕它会发生三个阶段的生态演替。

第一阶段叫食腐阶段。项目一停止维护,分叉马上就出现了。OpenOffice死了,LibreOffice接盘;MySQL被收购了,MariaDB冒出来。第二阶段叫富集阶段,更小的项目开始从尸体上提取特定的模块,或者围绕它构建兼容工具。第三阶段最有意思,叫化能合成阶段——就像深海热泉口的微生物一样,那些协议、文件格式、API规范,能持续支撑专业社区存活几十年。Docker的OCI规范、Atom编辑器留下的Tree-sitter,都是典型案例。

但这篇文章最发人深省的一个观察是什么呢?当云厂商把所有大型项目都收购或接管维护之后,"鲸落率"降低了,小型专业生态就失去了进化的机会。这就好比说,如果深海里所有的鲸鱼都被圈养起来永远不会死,那海底那套靠鲸落维持的生态系统就会彻底崩溃。这个思路太精彩了,它给我们理解技术生态系统的演化提供了一个全新的框架。

说到生态系统,还有一个跟开源相关的有趣讨论。因为AI生成的垃圾Pull Request越来越多,有人提出开源社区需要建立类似中世纪行会的信任机制——老贡献者给新人做担保,担保人的权重跟自身声望成正比,如果你担保的人是来捣乱的,你自己的声望也要受损。其实Debian的Web of Trust模型早就证明了这套东西是可行的。AI时代,信任反而变得更值钱了。

好,咱们说回硬件和制造业。今天有一组数据特别值得关注。

先说中国电动车。Rhodium Group的分析揭示了一个违反直觉的结论——中国电动车的价格优势,既不是来自低劳动力成本,也不主要来自补贴,而是来自极致的垂直整合。比亚迪和零跑是这方面的代表,从电池到电机到整车,能自己做的全部自己做。这也解释了为什么它们能在过去两年持续引领降价。

再看芯片这边,三条消息放在一起看特别震撼。美国从台湾的进口额已经超过了中国,主要就是数据中心芯片在拉动。Micron宣布在美国投资超过1500亿美元建内存工厂,台积电计划在亚利桑那再建4座工厂,投资1000亿美元。而如果英伟达的Vera Rubin芯片出货几千万颗,每颗需要20TB以上的SSD,光这一个芯片就要消耗去年全球NAND产能的20%。有评论者引用了哲学家Bostrom那个著名的"回形针最大化器"思想实验来形容这个趋势——AI对存储的需求,可能永远不会停止。

最后再快速聊两个我觉得特别值得关注的趋势。

第一个是Markdown的意外崛起。Cloudflare、Vercel、Laravel Cloud在短短几周内相继宣布支持"Markdown for Agents"。逻辑其实很简单,一篇普通博客的HTML加CSS加JavaScript大概500KB,转成Markdown只有2KB,体积减少99.6%。这不光是为了方便AI读取,更是帮网站主防御AI爬虫带来的流量冲击。有分析认为,Markdown可能会成为"新的RSS",通过AT Protocol这种协议重新解决内容发现的问题。WordPress创始人也在推动把这个功能加进去。

第二个是Andrej Karpathy提出的"Claw"概念。它描述的是一种新兴的AI系统层级——跑在个人硬件上、通过消息协议通信、能直接执行指令和调度任务的AI代理系统。围绕这个概念已经冒出了NanoClaw、zeroclaw、ironclaw等一系列项目。Karpathy认为这将是继"vibe coding"和"agentic engineering"之后又一个即将爆发的术语。

还有一个概念我觉得说得特别精准,叫Cruft Threshold——功能过载的临界点。就是说当你管理、评估和忽略新工具的成本超过任何单个工具带来的收益时,你就过了这个临界点。原文说得特别好,"我们大概在第14个应用添加AI总结按钮的时候就已经跨过了这条线。"每家公司都有增长团队,但没有一家公司有"减法团队"。这句话值得所有做产品的人反复品味。

所以你看,今天的信息拉通来看,AI行业正处在一个非常有意思的阶段。技术在狂飙突进,硬件推理速度突破万级,模型能力不断刷新,但与此同时,烧钱的速度也在狂飙,商业模式的可持续性远没有被证明。而在这场洪流之下,从开源生态的鲸落演替,到制造业供应链的重构,到内容分发方式的变革,整个技术世界都在经历一场深层的结构性调整。谁能在这场调整中找到可持续的位置,谁就是下一个十年的赢家。

好了,今天就到这里,我们明天见。