YOMOO 每日AI快送 · 2026年5月17日
📌 今日要览
中国深圳国家超算中心拿出"CPU堆出ExaFLOPS"的另类答卷,1.54 ExaFLOPS LineShine绕开英伟达封锁——主权算力分叉成型;OpenClaw三人小队一月烧掉130万美元跑100个Codex,xAI同日发布Grok Build入场AI编码;一份2005年的核武器仿真破坏工具被翻出,把"AI辅助攻击"的前史拉长了二十年;SpaceX把IPO提前到6月,1.75万亿美元估值刷史上最大。
🔥 主线一:LineShine超算——中国走通了"无GPU的ExaFLOPS"
当全世界都在为英伟达GPU排队时,深圳国家超算中心(NSCC)悄悄交出了一份完全不一样的答卷:LineShine用240万颗华为系Armv9 CPU核心,硬生生堆出1.54 ExaFLOPS的BF16训练算力——一块GPU都没有。
技术细节惊人。核心是定制的LX2处理器,每颗包含两个compute chiplet、共304个CPU核心,组成8个38核集群。每个核心配备Arm SVE(可伸缩向量扩展)和SME(可伸缩矩阵扩展),支持FP64/FP32/BF16/FP16/INT8——SME本质上就是Arm版的"张量核心",负责矩阵乘法。更激进的是内存子系统:32 GB片上HBM(4 TB/s带宽)+ 256 GB片外DDR5,沿用了富岳超算A64FX的思路,但首次在Armv9上落地。整机由20480个节点、40960颗LX2、共245万核组成,LingQi网络(LQLink)单节点1.6 Tb/s互连。
它意味着什么? 三个层次:
第一,封锁下的工程化突围。LineShine峰值理论FP64为2.47 ExaFLOPS,在训练63亿参数地球观测模型时实测峰值2.16 ExaFLOPS、稳定1.54 ExaFLOPS。虽然能效远不如GPU——参照xAI的Colossus理论峰值497.9 ExaFLOPS,实测约75 ExaFLOPS,LineShine只是它的零头——但这是在没有CUDA、没有H100/B200的前提下做出来的。
第二,CPU+大内存池的另一条路。GPU擅长稠密矩阵,但HBM容量受限(80-192 GB),长上下文、RAG(检索增强生成,让AI先查资料再回答)、AI for Science这种"算力+海量内存"的混合负载,CPU方案反而更顺手。同构架构还省掉了CPU-GPU数据搬运、显存碎片、编程模型割裂这些"异构税"。
第三,生态分叉信号。结合此前华为AI芯片营收翻倍、DeepSeek V4登昇腾、Cerebras IPO撬动推理市场,全球AI算力正在从"CUDA一统"走向"CUDA + Armv9/华为昇腾 + 晶圆级芯片"的多极格局。今天我们也看到FTC对Arm启动反垄断调查——Arm自己下场做AGI CPU引发Qualcomm、Apple等客户警觉,Arm架构本身的中立性也在松动。
代价同样真实。CPU方案能效差、稠密AI算力低,Anton Shilov指出"业界仍押注CPU+GPU异构"。但封锁逼出的"次优解",在工程上跑通到Exa级,本身就是未来五年AI基础设施分叉的信号弹——延续我们此前报道的国产AI双栈格局。
来源:Tom's Hardware、NSCC论文
💸 主线二:AI编码军备竞赛——三人烧130万,xAI入场追赶
OpenClaw之父Peter Steinberger晒出账单:30天烧掉130万美元、消耗6030亿token、发起760万次请求,全部由OpenAI报销。3人小队在云端常驻约100个Codex实例,自动审PR、扫安全漏洞、去重issue、修bug、监控性能回归、甚至旁听会议自动开PR。Top模型是GPT-5.5,单日峰值2万美元。
这个数字最反常识的地方在于"经济模型已经倒挂"。一个Codex Pro订阅每月200美元能换出5000-6000美元的API等值。Steinberger关闭"快速模式"后实际消耗约30万美元,等于60个Pro订阅。OpenAI对外口径是"每开发者每月100-200美元",但极端用例直接把估算撕碎——AI厂商正在用补贴换习惯,把开发者绑死在自家工作流上。
同一天,xAI推出Grok Build——首款AI编码Agent,SuperGrok Heavy订阅(300美元/月)起步,功能对标Claude Code。马斯克承认xAI"在编码上落后",过去几个月内部要求Grok全面对齐Claude性能。这是xAI在卖光算力转租赁后,业务重心向应用层的明显倾斜——前沿模型竞赛退场,转入垂直Agent。
底层趋势:Codex/Claude Code/Cursor/Grok Build四家正在抢同一批"高变现密度"的开发者用户。6.4k星的开源项目academic-research-skills(用Claude Code跑完整论文流水线、单篇成本4-6美元、内置反引用幻觉的Semantic Scholar核验)说明——生态正在从"会写代码的AI"转向"在AI上层搭流水线的人"。Token正在成为程序员菜单栏里的新基础资源。
来源:Tom's Hardware、Slashdot、量子位
🕵️ 主线三:Fast16曝光——核武器仿真破坏工具,比Stuxnet还早两年
赛门铁克与SentinelOne联合披露的Fast16框架,把"国家级网络武器"的历史向前拨了二十年。它最早组件可追溯至2005年——比Stuxnet早约两年。
作案手法极度精密。Fast16由三部分组成:嵌入Lua 5.0虚拟机的服务程序、boot启动的文件系统驱动、规则驱动的Hook引擎。驱动钩进NTFS,等到explorer.exe启动后,只对Intel编译器生成的.EXE文件做"读盘时即时打补丁"——动态注入恶意代码段。Hook引擎含101条字节模式规则,精准识别LS-DYNA和AUTODYN(工业级显式动力学仿真软件)的特定指令序列。
目标明确就是核武器仿真:代码只在材料密度突破30 g/cm³时激活——这正是铀在内爆装置冲击压缩下才能达到的密度门槛。它会悄悄把柯西应力张量(决定材料可压缩性的物理量)的输出值改成真实值的1%-10%,且不是直接归零——而是在密度30到60 g/cm³之间"自然斜率"地下降,模拟结果在外行看来合理,内行才能察觉异常。覆盖10个软件版本,意味着攻击方持续跟踪目标多年。
意义深远。这是首个有公开证据的、针对核武器研发管线本身的网络武器,而且早于Stuxnet。结合此前AI挖洞、AI辅助攻击macOS内核的趋势——网络攻防的攻击面早已不止于"窃取数据",而是篡改物理世界的设计输入。当AI能自动定位仿真软件中的关键指令序列,这类"二十年布局"的工程量会从国家级压缩到团队级。
来源:Security.com / Symantec Threat Hunter Team
🚀 主线四:SpaceX把IPO提前到6月,估值1.75万亿美元
SpaceX大幅加速IPO:招股书最早5月20日公开、6月4日路演、6月12日挂牌纳斯达克,代码"SPCX",拟募资700-750亿美元、估值约1.75万亿美元——刷史上最大IPO纪录(沙特阿美2019年约294亿美元)。两个月前与xAI合并时估值还是1.25万亿,三个月跳涨40%。
公司5月15日完成股票"一拆五"+ C类转A类,单股价从526美元降到105美元,降低散户门槛,计划邀请1500名散户参加专项配售。
最有看点的是治理结构:发行B类股,马斯克获10倍投票权——上市后无法被董事会解雇。董事会同时批准万亿级薪酬方案,与"火星建100万人定居点"和"100太瓦太空数据中心"两大目标挂钩。2025年SpaceX(含xAI)营收185亿美元、亏损50亿美元——xAI仍在烧钱期。
承接Anthropic绑定SpaceX 22万GPU、轨道数据中心100万卫星申请等线索,SpaceX正把"太空算力"作为下一代叙事压上IPO估值。
来源:路透社、WSJ、独角兽早知道
⚡ Quick Bites
- 黄仁勋反击Amodei:Nvidia CEO在斯坦福CS 153痛斥"把GPU比作原子弹很蠢"——"我向我的孩子推荐Nvidia GPU,我不会向任何人推荐原子弹"。延续他长期反对芯片对华出口管制的立场。
- 特朗普访京后,台湾自宣"主权独立":特朗普反对台湾正式独立、称140亿军售案是"很好的谈判筹码",台湾外交部当日声明"非中国一部分"。台积电亚利桑那1650亿美元投资可能因美方安全承诺动摇而变数增大。
- 立讯精密千亿女富豪:王来春身价突破1039亿,股价四月起涨55%,关键催化是收购京西国际(磁流变悬架+线控制动,德尔福技术血统),叠加郭明錤爆料其为OpenAI手机独家系统设计与制造伙伴。
- Bambu Lab违反AGPL:Prusa公开抨击中国3D打印软件的网络插件是"不可审计的黑盒",从2021年就被发现违反开源协议,叠加中国"五法框架"使企业必须配合情报机关——把开源合规问题升级为国家安全话题。
- Monzo数据网格落地:英国数字银行Monzo把12000个dbt模型(SQL转换为结构化数据集的模块化组件)按"分层+接口+CI强制校验"重构,降本40%、数据落地速度+25%。AI辅助编码普及下,这套CI护栏可能是大型组织数据治理的新模板。
- DeepSeek-V4-Flash让"模型转向"重新有用:Sean Goedecke提出,Flash版本足够强到值得本地跑"steering"(直接操纵模型激活值控制输出)。antirez的DwarfStar 4已内置steering——这是去除模型审查、定制行为的新前线。
- OpenClaw "Sparky"机箱机器人:基于Jetson Orin NX 16GB跑本地Gemma 4 E4B,30+传感器、200ms首token、完全离线——本地LLM硬件正在小型化、移动化。
- 英国改革1990年《计算机滥用法》:35年前为应对菲利普亲王邮箱被黑而立的法,长期把白帽研究员置于刑事风险。新法案承认AI驱动的自动化漏洞研究"机器速度"需求,但同时强化执法权。
- Mozilla反对英国年龄门控VPN:针对绕过《在线安全法》年龄验证的现象,英国DSIT考虑给VPN加年龄限制,Mozilla警告这将削弱所有用户的隐私基线。
👁️ Worth Watching
- 算力分叉:LineShine + 华为AI芯片 + DeepSeek昇腾 + Cerebras晶圆方案,正在把"AI算力 = Nvidia"的等式打破。下个观察点是2026下半年中国新一代国产大模型是否完全跳过CUDA训练栈。
- AI编码经济模型何时崩:Codex/Claude Code/Grok Build补贴战烧到什么时候?当极端用户(像OpenClaw)让单月成本超过60个订阅,要么涨价、要么限速、要么淘汰免费层——观察Anthropic和OpenAI的定价动作。
- AI辅助物理世界攻击:Fast16之后,下一个被披露的可能是"AI自动生成对仿真软件的篡改规则"。能否在水坝控制、电网调度、医疗设备仿真这类领域复现攻击模式,是接下来安全研究的关键议题。
- SpaceX上市后的太空算力叙事:首次试飞星舰12号窗口与IPO招股书披露同周——一旦"太空数据中心"从PPT走向工程节点,会触发地面数据中心电力/水资源压力(承接2900万加仑偷水)的政策再评估。
报告时长:约15分钟播报 · 续接昨日的M5被破、Bun六天迁移、Claude宝可梦三大议题——今日主轴转向算力分叉与AI编码经济。
大家好,欢迎来到2026年5月17日的 YOMOO 每日AI快送。
我跟你说,今天这第一条新闻,简直可以用"另类"两个字来形容。当全世界都在为英伟达的GPU排队、抢卡、抢配额的时候,中国深圳国家超算中心悄悄交出了一份完全不一样的答卷。一块GPU都没有,听清楚啊,一块都没有,他们用240万颗华为系的Armv9 CPU核心,硬生生堆出了1.54 ExaFLOPS的BF16训练算力。这套系统的名字叫LineShine。
你可能会问,CPU也能搞AI训练?而且还能堆到Exa级别?我们来看看这背后是什么样的工程。它的核心是一颗定制的处理器叫LX2,每颗芯片里塞了两个compute chiplet,一共304个CPU核心,组成8个集群。每个核心都配了Arm SVE,也就是可伸缩向量扩展,还有SME,可伸缩矩阵扩展。这个SME本质上是什么呢?就是Arm版本的"张量核心",专门负责矩阵乘法。更激进的是它的内存设计:32 GB的片上HBM,带宽4 TB/s,再加上256 GB的片外DDR5。这个思路其实跟日本的富岳超算很像,但是首次在Armv9上落地。整套系统呢,由20480个节点、40960颗LX2芯片、总共245万核心组成。
那这件事到底意味着什么?我觉得有三层意思。
第一层,这是封锁下的工程化突围。LineShine的理论峰值是2.47 ExaFLOPS,在实际训练一个63亿参数的地球观测模型时,实测峰值能到2.16 ExaFLOPS,稳定跑1.54 ExaFLOPS。你说它能效高吗?不高。对比一下,xAI的Colossus理论峰值是497.9 ExaFLOPS,实测大概75 ExaFLOPS,LineShine只是它的零头。但你要知道,这是在没有CUDA、没有H100、没有B200的前提下做出来的。
第二层,CPU加大内存池,其实是另一条路。GPU擅长稠密矩阵计算,但是它的HBM容量受限,一般就80到192 GB。可是像长上下文、像RAG,就是让AI先去查资料再回答,还有AI for Science这种"算力加海量内存"的混合负载,CPU方案反而更顺手。而且全是同构架构,你省掉了CPU到GPU之间的数据搬运,省掉了显存碎片,省掉了那一套编程模型割裂的"异构税"。
第三层,也是最重要的,这是一个生态分叉的信号。结合此前华为AI芯片营收翻倍、DeepSeek V4上昇腾、Cerebras晶圆方案IPO,全球AI算力正在从"CUDA一统"走向"CUDA加Armv9加华为昇腾加晶圆级芯片"的多极格局。而且就在今天,FTC对Arm启动了反垄断调查——因为Arm自己也下场做AGI CPU了,让Qualcomm、Apple这些客户感到警觉。所以你看,Arm架构本身的中立性都在松动。当然了,CPU方案能效差、稠密AI算力低,这都是真实的代价。但是封锁逼出来的次优解,能在工程上跑通到Exa级别,本身就是未来五年AI基础设施分叉的信号弹。
接下来咱们聊第二件事,AI编码这个赛道,已经进入了真金白银的军备竞赛阶段。
有一个数字我看了直接惊呆了。OpenClaw之父Peter Steinberger晒出了一份账单:30天,烧掉130万美元,消耗了6030亿token,发起了760万次请求,全部由OpenAI报销。注意,他们就3个人。这3个人在云端常驻大约100个Codex实例,自动审PR、扫安全漏洞、去重issue、修bug、监控性能回归,甚至还能旁听会议自动开PR。用的是GPT-5.5这个顶级模型,单日峰值消耗2万美元。
这个数字最反常识的地方在哪?在于经济模型已经倒挂了。一个Codex Pro订阅每月才200美元,但能换出5000到6000美元的API等值消耗。Steinberger关掉"快速模式"之后,实际消耗是30万美元,相当于60个Pro订阅的价值。OpenAI对外口径是"每个开发者每月100到200美元",但极端用例直接把这个估算给撕碎了。说白了,AI厂商现在就是在用补贴换习惯,要把开发者绑死在自家的工作流里。
同一天,xAI推出了Grok Build,这是它家第一款AI编码Agent,要订阅SuperGrok Heavy,每月300美元起步,功能对标Claude Code。马斯克自己都承认,xAI在编码这件事上落后了,过去几个月内部要求Grok全面对齐Claude的性能。这其实是xAI在卖光算力转租赁之后,业务重心明显向应用层倾斜的信号——前沿模型那场仗已经退场,现在大家都挤进垂直Agent这条赛道。
所以你看到没有,Codex、Claude Code、Cursor、Grok Build,四家正在抢同一批"高变现密度"的开发者用户。还有一个6.4k星的开源项目叫academic-research-skills,用Claude Code跑完整的论文流水线,单篇成本4到6美元,内置反引用幻觉的Semantic Scholar核验。这说明什么?生态正在从"会写代码的AI"转向"在AI上层搭流水线的人"。Token已经成了程序员菜单栏里的新基础资源。
好,下一条新闻。这一条说实话有点让人后背发凉。
赛门铁克和SentinelOne联合披露了一个叫Fast16的网络武器框架,这个东西把"国家级网络武器"的历史向前拨了整整二十年。它最早的组件可以追溯到2005年,比那个著名的震网病毒Stuxnet还要早两年。
它的作案手法极度精密。Fast16由三个部分组成:一个嵌入Lua 5.0虚拟机的服务程序,一个开机就启动的文件系统驱动,还有一个规则驱动的Hook引擎。驱动钩进NTFS文件系统之后,等到explorer.exe启动了,它只对Intel编译器生成的.EXE文件做"读盘时即时打补丁",动态注入恶意代码段。Hook引擎里有101条字节模式规则,专门精准识别LS-DYNA和AUTODYN——这是两套工业级显式动力学仿真软件——的特定指令序列。
它的目标,明确就是核武器仿真。代码只在材料密度突破30克每立方厘米的时候才激活,而这个数字,正是铀在内爆装置冲击压缩下才能达到的密度门槛。它会悄悄把柯西应力张量——这是决定材料可压缩性的物理量——的输出值改成真实值的1%到10%。而且不是直接归零这种粗暴操作,而是在密度30到60之间"自然斜率"地下降。这是什么意思?这意味着仿真结果在外行看来完全合理,只有真正的内行才能察觉异常。覆盖10个软件版本,意味着攻击方持续跟踪目标多年。
你想想看这件事的意义。这是首个有公开证据的、针对核武器研发管线本身的网络武器,而且早于Stuxnet二十年。结合此前AI挖洞、AI辅助攻击macOS内核的趋势,网络攻防的攻击面早已不止于"窃取数据",而是篡改物理世界的设计输入。最让我担心的是,当AI能自动定位仿真软件中的关键指令序列,这类"二十年布局"的工程量,会从国家级压缩到团队级。这就是接下来安全研究最关键的议题。
第四条主线,咱们说点资本市场的事。SpaceX大幅加速了IPO的时间表,简直是火箭速度。
招股书最早5月20日就要公开,6月4日路演,6月12日就要挂牌纳斯达克,代码SPCX。计划募资700到750亿美元,估值约1.75万亿美元,这个数字什么概念?直接刷新历史最大IPO纪录。之前的记录保持者是2019年的沙特阿美,大概294亿美元。两个月前与xAI合并的时候,SpaceX的估值还是1.25万亿,三个月跳涨40%。
公司5月15日刚刚完成了股票"一拆五",加上C类转A类,单股价从526美元降到105美元,明显是在降低散户的门槛,还计划邀请1500名散户参加专项配售。
但是最有看点的不是这些数字,而是它的治理结构。公司发行了B类股,马斯克获得10倍的投票权——这意味着什么?上市之后,他无法被董事会解雇。同时董事会还批准了一个万亿级的薪酬方案,这个薪酬跟两个目标挂钩:第一是火星建100万人定居点,第二是100太瓦的太空数据中心。2025年SpaceX包含xAI的营收是185亿美元,但是亏损50亿美元,xAI仍然在烧钱期。
承接之前Anthropic绑定SpaceX 22万GPU、轨道数据中心100万卫星申请这些线索,SpaceX正在把"太空算力"作为下一代叙事压上IPO估值。这盘棋下得真大。
接下来咱们快速过一下今天的其他几条要闻。
黄仁勋反击Amodei。Nvidia CEO在斯坦福CS 153的课上痛斥"把GPU比作原子弹很蠢",他说我向我的孩子推荐Nvidia GPU,我不会向任何人推荐原子弹。这也延续了他长期反对芯片对华出口管制的立场。
特朗普访京之后,台湾自宣"主权独立"。特朗普反对台湾正式独立,称140亿军售案是"很好的谈判筹码",台湾外交部当天就声明"非中国一部分"。台积电亚利桑那1650亿美元的投资,可能因为美方安全承诺动摇而出现变数。
立讯精密出了一位千亿女富豪,王来春身价突破1039亿。股价四月起涨55%,关键催化是收购了京西国际,这家公司有德尔福的技术血统,做磁流变悬架和线控制动。再叠加郭明錤爆料立讯是OpenAI手机独家系统设计与制造伙伴。
Bambu Lab违反AGPL开源协议被Prusa公开抨击,说中国3D打印软件的网络插件是"不可审计的黑盒",从2021年就被发现违反开源协议。叠加中国"五法框架"要求企业配合情报机关,把开源合规问题直接升级为国家安全话题。
英国数字银行Monzo把12000个dbt模型重构,按"分层加接口加CI强制校验"的方式落地数据网格,降本40%、数据落地速度提升25%。在AI辅助编码普及的当下,这套CI护栏可能是大型组织数据治理的新模板。
DeepSeek-V4-Flash让"模型转向"重新有用了。Sean Goedecke提出,Flash版本已经足够强到值得本地跑steering,就是直接操纵模型激活值控制输出。antirez的DwarfStar 4已经内置了这个能力。这是去除模型审查、定制行为的新前线。
OpenClaw发布了一个叫Sparky的机箱机器人,基于Jetson Orin NX 16GB跑本地Gemma 4 E4B,30多个传感器,200毫秒首token,完全离线。本地LLM硬件正在小型化、移动化。
英国正在改革1990年的《计算机滥用法》。这部35年前为应对菲利普亲王邮箱被黑而立的法律,长期把白帽研究员置于刑事风险中。新法案承认AI驱动的自动化漏洞研究"机器速度"的需求,但同时也强化了执法权。
Mozilla反对英国年龄门控VPN。针对绕过《在线安全法》年龄验证的现象,英国DSIT考虑给VPN加年龄限制,Mozilla警告这将削弱所有用户的隐私基线。
最后,咱们聊聊几个值得继续盯着看的趋势。
第一个是算力分叉。LineShine加华为AI芯片加DeepSeek昇腾加Cerebras晶圆方案,正在把"AI算力等于Nvidia"这个等式打破。下一个观察点是2026下半年,中国新一代国产大模型,会不会完全跳过CUDA训练栈。
第二个是AI编码的经济模型什么时候崩。Codex、Claude Code、Grok Build这场补贴战要烧到什么时候?当像OpenClaw这种极端用户让单月成本超过60个订阅,要么涨价、要么限速、要么淘汰免费层。看Anthropic和OpenAI接下来的定价动作。
第三个是AI辅助物理世界攻击。Fast16之后,下一个被披露的,可能就是"AI自动生成对仿真软件的篡改规则"。能不能在水坝控制、电网调度、医疗设备仿真这类领域复现攻击模式,是接下来安全研究的关键议题。
第四个是SpaceX上市之后的太空算力叙事。星舰12号首次试飞窗口和IPO招股书披露在同一周,一旦"太空数据中心"从PPT走向工程节点,会触发地面数据中心电力和水资源压力的政策再评估。
好了,今天的内容差不多就这些。如果你想通过阅读文字版更快地获取每日的AI快送信息,欢迎免费订阅我们的mail list,地址在视频描述里。如果您觉得我们的节目对您有帮助,请帮忙分享、转发给您的朋友。好了,今天就到这里,我们明天见!