YOMOO 每日AI快送 · 2026年5月17日

📌 今日要览

中国深圳国家超算中心拿出"CPU堆出ExaFLOPS"的另类答卷,1.54 ExaFLOPS LineShine绕开英伟达封锁——主权算力分叉成型;OpenClaw三人小队一月烧掉130万美元跑100个Codex,xAI同日发布Grok Build入场AI编码;一份2005年的核武器仿真破坏工具被翻出,把"AI辅助攻击"的前史拉长了二十年;SpaceX把IPO提前到6月,1.75万亿美元估值刷史上最大。

🔥 主线一:LineShine超算——中国走通了"无GPU的ExaFLOPS"

当全世界都在为英伟达GPU排队时,深圳国家超算中心(NSCC)悄悄交出了一份完全不一样的答卷:LineShine用240万颗华为系Armv9 CPU核心,硬生生堆出1.54 ExaFLOPS的BF16训练算力——一块GPU都没有。

技术细节惊人。核心是定制的LX2处理器,每颗包含两个compute chiplet、共304个CPU核心,组成8个38核集群。每个核心配备Arm SVE(可伸缩向量扩展)和SME(可伸缩矩阵扩展),支持FP64/FP32/BF16/FP16/INT8——SME本质上就是Arm版的"张量核心",负责矩阵乘法。更激进的是内存子系统:32 GB片上HBM(4 TB/s带宽)+ 256 GB片外DDR5,沿用了富岳超算A64FX的思路,但首次在Armv9上落地。整机由20480个节点、40960颗LX2、共245万核组成,LingQi网络(LQLink)单节点1.6 Tb/s互连。

它意味着什么? 三个层次:

第一,封锁下的工程化突围。LineShine峰值理论FP64为2.47 ExaFLOPS,在训练63亿参数地球观测模型时实测峰值2.16 ExaFLOPS、稳定1.54 ExaFLOPS。虽然能效远不如GPU——参照xAI的Colossus理论峰值497.9 ExaFLOPS,实测约75 ExaFLOPS,LineShine只是它的零头——但这是在没有CUDA、没有H100/B200的前提下做出来的。

第二,CPU+大内存池的另一条路。GPU擅长稠密矩阵,但HBM容量受限(80-192 GB),长上下文、RAG(检索增强生成,让AI先查资料再回答)、AI for Science这种"算力+海量内存"的混合负载,CPU方案反而更顺手。同构架构还省掉了CPU-GPU数据搬运、显存碎片、编程模型割裂这些"异构税"。

第三,生态分叉信号。结合此前华为AI芯片营收翻倍、DeepSeek V4登昇腾、Cerebras IPO撬动推理市场,全球AI算力正在从"CUDA一统"走向"CUDA + Armv9/华为昇腾 + 晶圆级芯片"的多极格局。今天我们也看到FTC对Arm启动反垄断调查——Arm自己下场做AGI CPU引发Qualcomm、Apple等客户警觉,Arm架构本身的中立性也在松动。

代价同样真实。CPU方案能效差、稠密AI算力低,Anton Shilov指出"业界仍押注CPU+GPU异构"。但封锁逼出的"次优解",在工程上跑通到Exa级,本身就是未来五年AI基础设施分叉的信号弹——延续我们此前报道的国产AI双栈格局。

来源:Tom's Hardware、NSCC论文

💸 主线二:AI编码军备竞赛——三人烧130万,xAI入场追赶

OpenClaw之父Peter Steinberger晒出账单:30天烧掉130万美元、消耗6030亿token、发起760万次请求,全部由OpenAI报销。3人小队在云端常驻约100个Codex实例,自动审PR、扫安全漏洞、去重issue、修bug、监控性能回归、甚至旁听会议自动开PR。Top模型是GPT-5.5,单日峰值2万美元。

这个数字最反常识的地方在于"经济模型已经倒挂"。一个Codex Pro订阅每月200美元能换出5000-6000美元的API等值。Steinberger关闭"快速模式"后实际消耗约30万美元,等于60个Pro订阅。OpenAI对外口径是"每开发者每月100-200美元",但极端用例直接把估算撕碎——AI厂商正在用补贴换习惯,把开发者绑死在自家工作流上。

同一天,xAI推出Grok Build——首款AI编码Agent,SuperGrok Heavy订阅(300美元/月)起步,功能对标Claude Code。马斯克承认xAI"在编码上落后",过去几个月内部要求Grok全面对齐Claude性能。这是xAI在卖光算力转租赁后,业务重心向应用层的明显倾斜——前沿模型竞赛退场,转入垂直Agent。

底层趋势:Codex/Claude Code/Cursor/Grok Build四家正在抢同一批"高变现密度"的开发者用户。6.4k星的开源项目academic-research-skills(用Claude Code跑完整论文流水线、单篇成本4-6美元、内置反引用幻觉的Semantic Scholar核验)说明——生态正在从"会写代码的AI"转向"在AI上层搭流水线的人"。Token正在成为程序员菜单栏里的新基础资源。

来源:Tom's Hardware、Slashdot、量子位

🕵️ 主线三:Fast16曝光——核武器仿真破坏工具,比Stuxnet还早两年

赛门铁克与SentinelOne联合披露的Fast16框架,把"国家级网络武器"的历史向前拨了二十年。它最早组件可追溯至2005年——比Stuxnet早约两年。

作案手法极度精密。Fast16由三部分组成:嵌入Lua 5.0虚拟机的服务程序、boot启动的文件系统驱动、规则驱动的Hook引擎。驱动钩进NTFS,等到explorer.exe启动后,只对Intel编译器生成的.EXE文件做"读盘时即时打补丁"——动态注入恶意代码段。Hook引擎含101条字节模式规则,精准识别LS-DYNA和AUTODYN(工业级显式动力学仿真软件)的特定指令序列。

目标明确就是核武器仿真:代码只在材料密度突破30 g/cm³时激活——这正是铀在内爆装置冲击压缩下才能达到的密度门槛。它会悄悄把柯西应力张量(决定材料可压缩性的物理量)的输出值改成真实值的1%-10%,且不是直接归零——而是在密度30到60 g/cm³之间"自然斜率"地下降,模拟结果在外行看来合理,内行才能察觉异常。覆盖10个软件版本,意味着攻击方持续跟踪目标多年。

意义深远。这是首个有公开证据的、针对核武器研发管线本身的网络武器,而且早于Stuxnet。结合此前AI挖洞、AI辅助攻击macOS内核的趋势——网络攻防的攻击面早已不止于"窃取数据",而是篡改物理世界的设计输入。当AI能自动定位仿真软件中的关键指令序列,这类"二十年布局"的工程量会从国家级压缩到团队级。

来源:Security.com / Symantec Threat Hunter Team

🚀 主线四:SpaceX把IPO提前到6月,估值1.75万亿美元

SpaceX大幅加速IPO:招股书最早5月20日公开、6月4日路演、6月12日挂牌纳斯达克,代码"SPCX",拟募资700-750亿美元、估值约1.75万亿美元——刷史上最大IPO纪录(沙特阿美2019年约294亿美元)。两个月前与xAI合并时估值还是1.25万亿,三个月跳涨40%。

公司5月15日完成股票"一拆五"+ C类转A类,单股价从526美元降到105美元,降低散户门槛,计划邀请1500名散户参加专项配售。

最有看点的是治理结构:发行B类股,马斯克获10倍投票权——上市后无法被董事会解雇。董事会同时批准万亿级薪酬方案,与"火星建100万人定居点"和"100太瓦太空数据中心"两大目标挂钩。2025年SpaceX(含xAI)营收185亿美元、亏损50亿美元——xAI仍在烧钱期。

承接Anthropic绑定SpaceX 22万GPU、轨道数据中心100万卫星申请等线索,SpaceX正把"太空算力"作为下一代叙事压上IPO估值。

来源:路透社、WSJ、独角兽早知道

⚡ Quick Bites

黄仁勋反击Amodei:Nvidia CEO在斯坦福CS 153痛斥"把GPU比作原子弹很蠢"——"我向我的孩子推荐Nvidia GPU,我不会向任何人推荐原子弹"。延续他长期反对芯片对华出口管制的立场。
特朗普访京后,台湾自宣"主权独立":特朗普反对台湾正式独立、称140亿军售案是"很好的谈判筹码",台湾外交部当日声明"非中国一部分"。台积电亚利桑那1650亿美元投资可能因美方安全承诺动摇而变数增大。
立讯精密千亿女富豪:王来春身价突破1039亿,股价四月起涨55%,关键催化是收购京西国际(磁流变悬架+线控制动,德尔福技术血统),叠加郭明錤爆料其为OpenAI手机独家系统设计与制造伙伴。
Bambu Lab违反AGPL:Prusa公开抨击中国3D打印软件的网络插件是"不可审计的黑盒",从2021年就被发现违反开源协议,叠加中国"五法框架"使企业必须配合情报机关——把开源合规问题升级为国家安全话题。
Monzo数据网格落地:英国数字银行Monzo把12000个dbt模型(SQL转换为结构化数据集的模块化组件)按"分层+接口+CI强制校验"重构,降本40%、数据落地速度+25%。AI辅助编码普及下,这套CI护栏可能是大型组织数据治理的新模板。
DeepSeek-V4-Flash让"模型转向"重新有用:Sean Goedecke提出,Flash版本足够强到值得本地跑"steering"(直接操纵模型激活值控制输出)。antirez的DwarfStar 4已内置steering——这是去除模型审查、定制行为的新前线。
OpenClaw "Sparky"机箱机器人:基于Jetson Orin NX 16GB跑本地Gemma 4 E4B,30+传感器、200ms首token、完全离线——本地LLM硬件正在小型化、移动化。
英国改革1990年《计算机滥用法》:35年前为应对菲利普亲王邮箱被黑而立的法,长期把白帽研究员置于刑事风险。新法案承认AI驱动的自动化漏洞研究"机器速度"需求,但同时强化执法权。
Mozilla反对英国年龄门控VPN:针对绕过《在线安全法》年龄验证的现象,英国DSIT考虑给VPN加年龄限制,Mozilla警告这将削弱所有用户的隐私基线。

👁️ Worth Watching

算力分叉:LineShine + 华为AI芯片 + DeepSeek昇腾 + Cerebras晶圆方案,正在把"AI算力 = Nvidia"的等式打破。下个观察点是2026下半年中国新一代国产大模型是否完全跳过CUDA训练栈。
AI编码经济模型何时崩:Codex/Claude Code/Grok Build补贴战烧到什么时候?当极端用户(像OpenClaw)让单月成本超过60个订阅,要么涨价、要么限速、要么淘汰免费层——观察Anthropic和OpenAI的定价动作。
AI辅助物理世界攻击:Fast16之后,下一个被披露的可能是"AI自动生成对仿真软件的篡改规则"。能否在水坝控制、电网调度、医疗设备仿真这类领域复现攻击模式,是接下来安全研究的关键议题。
SpaceX上市后的太空算力叙事:首次试飞星舰12号窗口与IPO招股书披露同周——一旦"太空数据中心"从PPT走向工程节点,会触发地面数据中心电力/水资源压力(承接2900万加仑偷水)的政策再评估。

报告时长:约15分钟播报 · 续接昨日的M5被破、Bun六天迁移、Claude宝可梦三大议题——今日主轴转向算力分叉与AI编码经济。

PODCAST SCRIPT

大家好，欢迎来到2026年5月17日的 YOMOO 每日AI快送。

我跟你说，今天这第一条新闻，简直可以用"另类"两个字来形容。当全世界都在为英伟达的GPU排队、抢卡、抢配额的时候，中国深圳国家超算中心悄悄交出了一份完全不一样的答卷。一块GPU都没有，听清楚啊，一块都没有，他们用240万颗华为系的Armv9 CPU核心，硬生生堆出了1.54 ExaFLOPS的BF16训练算力。这套系统的名字叫LineShine。

你可能会问，CPU也能搞AI训练？而且还能堆到Exa级别？我们来看看这背后是什么样的工程。它的核心是一颗定制的处理器叫LX2，每颗芯片里塞了两个compute chiplet，一共304个CPU核心，组成8个集群。每个核心都配了Arm SVE，也就是可伸缩向量扩展，还有SME，可伸缩矩阵扩展。这个SME本质上是什么呢？就是Arm版本的"张量核心"，专门负责矩阵乘法。更激进的是它的内存设计：32 GB的片上HBM，带宽4 TB/s，再加上256 GB的片外DDR5。这个思路其实跟日本的富岳超算很像，但是首次在Armv9上落地。整套系统呢，由20480个节点、40960颗LX2芯片、总共245万核心组成。

那这件事到底意味着什么？我觉得有三层意思。

第一层，这是封锁下的工程化突围。LineShine的理论峰值是2.47 ExaFLOPS，在实际训练一个63亿参数的地球观测模型时，实测峰值能到2.16 ExaFLOPS，稳定跑1.54 ExaFLOPS。你说它能效高吗？不高。对比一下，xAI的Colossus理论峰值是497.9 ExaFLOPS，实测大概75 ExaFLOPS，LineShine只是它的零头。但你要知道，这是在没有CUDA、没有H100、没有B200的前提下做出来的。

第二层，CPU加大内存池，其实是另一条路。GPU擅长稠密矩阵计算，但是它的HBM容量受限，一般就80到192 GB。可是像长上下文、像RAG，就是让AI先去查资料再回答，还有AI for Science这种"算力加海量内存"的混合负载，CPU方案反而更顺手。而且全是同构架构，你省掉了CPU到GPU之间的数据搬运，省掉了显存碎片，省掉了那一套编程模型割裂的"异构税"。

第三层，也是最重要的，这是一个生态分叉的信号。结合此前华为AI芯片营收翻倍、DeepSeek V4上昇腾、Cerebras晶圆方案IPO，全球AI算力正在从"CUDA一统"走向"CUDA加Armv9加华为昇腾加晶圆级芯片"的多极格局。而且就在今天，FTC对Arm启动了反垄断调查——因为Arm自己也下场做AGI CPU了，让Qualcomm、Apple这些客户感到警觉。所以你看，Arm架构本身的中立性都在松动。当然了，CPU方案能效差、稠密AI算力低，这都是真实的代价。但是封锁逼出来的次优解，能在工程上跑通到Exa级别，本身就是未来五年AI基础设施分叉的信号弹。

接下来咱们聊第二件事，AI编码这个赛道，已经进入了真金白银的军备竞赛阶段。

有一个数字我看了直接惊呆了。OpenClaw之父Peter Steinberger晒出了一份账单：30天，烧掉130万美元，消耗了6030亿token，发起了760万次请求，全部由OpenAI报销。注意，他们就3个人。这3个人在云端常驻大约100个Codex实例，自动审PR、扫安全漏洞、去重issue、修bug、监控性能回归，甚至还能旁听会议自动开PR。用的是GPT-5.5这个顶级模型，单日峰值消耗2万美元。

这个数字最反常识的地方在哪？在于经济模型已经倒挂了。一个Codex Pro订阅每月才200美元，但能换出5000到6000美元的API等值消耗。Steinberger关掉"快速模式"之后，实际消耗是30万美元，相当于60个Pro订阅的价值。OpenAI对外口径是"每个开发者每月100到200美元"，但极端用例直接把这个估算给撕碎了。说白了，AI厂商现在就是在用补贴换习惯，要把开发者绑死在自家的工作流里。

同一天，xAI推出了Grok Build，这是它家第一款AI编码Agent，要订阅SuperGrok Heavy，每月300美元起步，功能对标Claude Code。马斯克自己都承认，xAI在编码这件事上落后了，过去几个月内部要求Grok全面对齐Claude的性能。这其实是xAI在卖光算力转租赁之后，业务重心明显向应用层倾斜的信号——前沿模型那场仗已经退场，现在大家都挤进垂直Agent这条赛道。

所以你看到没有，Codex、Claude Code、Cursor、Grok Build，四家正在抢同一批"高变现密度"的开发者用户。还有一个6.4k星的开源项目叫academic-research-skills，用Claude Code跑完整的论文流水线，单篇成本4到6美元，内置反引用幻觉的Semantic Scholar核验。这说明什么？生态正在从"会写代码的AI"转向"在AI上层搭流水线的人"。Token已经成了程序员菜单栏里的新基础资源。

好，下一条新闻。这一条说实话有点让人后背发凉。

赛门铁克和SentinelOne联合披露了一个叫Fast16的网络武器框架，这个东西把"国家级网络武器"的历史向前拨了整整二十年。它最早的组件可以追溯到2005年，比那个著名的震网病毒Stuxnet还要早两年。

它的作案手法极度精密。Fast16由三个部分组成：一个嵌入Lua 5.0虚拟机的服务程序，一个开机就启动的文件系统驱动，还有一个规则驱动的Hook引擎。驱动钩进NTFS文件系统之后，等到explorer.exe启动了，它只对Intel编译器生成的.EXE文件做"读盘时即时打补丁"，动态注入恶意代码段。Hook引擎里有101条字节模式规则，专门精准识别LS-DYNA和AUTODYN——这是两套工业级显式动力学仿真软件——的特定指令序列。

它的目标，明确就是核武器仿真。代码只在材料密度突破30克每立方厘米的时候才激活，而这个数字，正是铀在内爆装置冲击压缩下才能达到的密度门槛。它会悄悄把柯西应力张量——这是决定材料可压缩性的物理量——的输出值改成真实值的1%到10%。而且不是直接归零这种粗暴操作，而是在密度30到60之间"自然斜率"地下降。这是什么意思？这意味着仿真结果在外行看来完全合理，只有真正的内行才能察觉异常。覆盖10个软件版本，意味着攻击方持续跟踪目标多年。

你想想看这件事的意义。这是首个有公开证据的、针对核武器研发管线本身的网络武器，而且早于Stuxnet二十年。结合此前AI挖洞、AI辅助攻击macOS内核的趋势，网络攻防的攻击面早已不止于"窃取数据"，而是篡改物理世界的设计输入。最让我担心的是，当AI能自动定位仿真软件中的关键指令序列，这类"二十年布局"的工程量，会从国家级压缩到团队级。这就是接下来安全研究最关键的议题。

第四条主线，咱们说点资本市场的事。SpaceX大幅加速了IPO的时间表，简直是火箭速度。

招股书最早5月20日就要公开，6月4日路演，6月12日就要挂牌纳斯达克，代码SPCX。计划募资700到750亿美元，估值约1.75万亿美元，这个数字什么概念？直接刷新历史最大IPO纪录。之前的记录保持者是2019年的沙特阿美，大概294亿美元。两个月前与xAI合并的时候，SpaceX的估值还是1.25万亿，三个月跳涨40%。

公司5月15日刚刚完成了股票"一拆五"，加上C类转A类，单股价从526美元降到105美元，明显是在降低散户的门槛，还计划邀请1500名散户参加专项配售。

但是最有看点的不是这些数字，而是它的治理结构。公司发行了B类股，马斯克获得10倍的投票权——这意味着什么？上市之后，他无法被董事会解雇。同时董事会还批准了一个万亿级的薪酬方案，这个薪酬跟两个目标挂钩：第一是火星建100万人定居点，第二是100太瓦的太空数据中心。2025年SpaceX包含xAI的营收是185亿美元，但是亏损50亿美元，xAI仍然在烧钱期。

承接之前Anthropic绑定SpaceX 22万GPU、轨道数据中心100万卫星申请这些线索，SpaceX正在把"太空算力"作为下一代叙事压上IPO估值。这盘棋下得真大。

接下来咱们快速过一下今天的其他几条要闻。

黄仁勋反击Amodei。Nvidia CEO在斯坦福CS 153的课上痛斥"把GPU比作原子弹很蠢"，他说我向我的孩子推荐Nvidia GPU，我不会向任何人推荐原子弹。这也延续了他长期反对芯片对华出口管制的立场。

特朗普访京之后，台湾自宣"主权独立"。特朗普反对台湾正式独立，称140亿军售案是"很好的谈判筹码"，台湾外交部当天就声明"非中国一部分"。台积电亚利桑那1650亿美元的投资，可能因为美方安全承诺动摇而出现变数。

立讯精密出了一位千亿女富豪，王来春身价突破1039亿。股价四月起涨55%，关键催化是收购了京西国际，这家公司有德尔福的技术血统，做磁流变悬架和线控制动。再叠加郭明錤爆料立讯是OpenAI手机独家系统设计与制造伙伴。

Bambu Lab违反AGPL开源协议被Prusa公开抨击，说中国3D打印软件的网络插件是"不可审计的黑盒"，从2021年就被发现违反开源协议。叠加中国"五法框架"要求企业配合情报机关，把开源合规问题直接升级为国家安全话题。

英国数字银行Monzo把12000个dbt模型重构，按"分层加接口加CI强制校验"的方式落地数据网格，降本40%、数据落地速度提升25%。在AI辅助编码普及的当下，这套CI护栏可能是大型组织数据治理的新模板。

DeepSeek-V4-Flash让"模型转向"重新有用了。Sean Goedecke提出，Flash版本已经足够强到值得本地跑steering，就是直接操纵模型激活值控制输出。antirez的DwarfStar 4已经内置了这个能力。这是去除模型审查、定制行为的新前线。

OpenClaw发布了一个叫Sparky的机箱机器人，基于Jetson Orin NX 16GB跑本地Gemma 4 E4B，30多个传感器，200毫秒首token，完全离线。本地LLM硬件正在小型化、移动化。

英国正在改革1990年的《计算机滥用法》。这部35年前为应对菲利普亲王邮箱被黑而立的法律，长期把白帽研究员置于刑事风险中。新法案承认AI驱动的自动化漏洞研究"机器速度"的需求，但同时也强化了执法权。

Mozilla反对英国年龄门控VPN。针对绕过《在线安全法》年龄验证的现象，英国DSIT考虑给VPN加年龄限制，Mozilla警告这将削弱所有用户的隐私基线。

最后，咱们聊聊几个值得继续盯着看的趋势。

第一个是算力分叉。LineShine加华为AI芯片加DeepSeek昇腾加Cerebras晶圆方案，正在把"AI算力等于Nvidia"这个等式打破。下一个观察点是2026下半年，中国新一代国产大模型，会不会完全跳过CUDA训练栈。

第二个是AI编码的经济模型什么时候崩。Codex、Claude Code、Grok Build这场补贴战要烧到什么时候？当像OpenClaw这种极端用户让单月成本超过60个订阅，要么涨价、要么限速、要么淘汰免费层。看Anthropic和OpenAI接下来的定价动作。

第三个是AI辅助物理世界攻击。Fast16之后，下一个被披露的，可能就是"AI自动生成对仿真软件的篡改规则"。能不能在水坝控制、电网调度、医疗设备仿真这类领域复现攻击模式，是接下来安全研究的关键议题。

第四个是SpaceX上市之后的太空算力叙事。星舰12号首次试飞窗口和IPO招股书披露在同一周，一旦"太空数据中心"从PPT走向工程节点，会触发地面数据中心电力和水资源压力的政策再评估。

好了，今天的内容差不多就这些。如果你想通过阅读文字版更快地获取每日的AI快送信息，欢迎免费订阅我们的mail list，地址在视频描述里。如果您觉得我们的节目对您有帮助，请帮忙分享、转发给您的朋友。好了，今天就到这里，我们明天见！