YOMOO 每日 AI 快送 · 2026-04-29

执行摘要

今天最大的反常识来自硅谷自己人:Nvidia 副总裁与 Uber CTO 同日承认 AI token 成本已经超过员工工资,而一项 26,904 次的实测显示 AI 给同一张照片估算碳水时,胰岛素剂量误差能跨越 42.9 个单位——足以致命。在这两条裂缝之间,OpenAI 硬件负责人首次系统揭示了从芯片到手机的全栈意图,GitHub 则在 Hashimoto 公开出走后正式道歉。AI 的经济与可靠性两根支柱,同一天被同时撼动。

主线一·AI 经济悖论:Token 比人贵,可还是要烧

Nvidia 应用深度学习副总裁 Bryan Catanzaro 对 Axios 直言:"对我团队来说,算力成本远超员工成本。"这句话出自全球卖铲人之口,分量不轻。Uber CTO Praveen Naga 同步表态——他"得回到画板重画预算,因为原来想要的预算两周前就花光了"。Swan AI 的 Amos Bar-Joseph 则在 LinkedIn 晒出一张 Anthropic 11.3 万美元月账单,四人小队人均 2.8 万美元/月,远高于人力工资。

更扎心的是 MIT 2024 年研究:77% 的任务下,人类做事仍优于 AI。但 CEO 们不为所动,他们把高额账单视为"自动化进步"的证据。黄仁勋甚至要求年薪 50 万美元的工程师每年消耗至少 25 万美元的 token。Naga 的愿景更直接:"CTO 这份工作要从软件工程,转型为 AI 代理软件工程。"

这条经济叙事并不孤立。一项刚发布的预印本研究将 13 张食物照片分别向 GPT-5.4、Claude Sonnet 4.6、Gemini 2.5/3.1 Pro 各发送 500+ 次,共 26,904 次查询,提示词完全相同。结果惊人:一张西班牙海鲜饭(paella)的碳水估值,Gemini 2.5 Pro 在 55g 到 484g 之间反复横跳,按 1:10 胰岛素碳水比换算,单张照片 2000 次查询的差距等于 42.9 单位胰岛素——足以引发严重低血糖致死。Claude 最稳定(变异系数 2.4%),但对一份 40g 的奶酪三明治三个模型一致估成 28g,精确地错了 12g。最讽刺的是模型给出的"置信度"分数与准确率几乎零相关:Claude 报 0.85+ 高置信度时反而比低置信度更不准。

把两条线索叠在一起:企业愿意为不可靠的 token 付出超员工工资的钱,而模型在一个有人可能因此进 ICU 的场景下,连"同问 500 次给出相近答案"这件最基础的事都做不到。AI 经济叙事的脆弱处不是钱不够花,而是付出去的钱并不能买到对应的确定性。英国糖尿病技术网络(DTN-UK)早已声明:通用大模型禁止用作胰岛素剂量自主咨询计算器——这份预印本恰好是其量化证据。

主线二·OpenAI 硬件全栈:手机不是终点,操作系统才是

极客公园披露的 Stanford 闭门交流揭出 OpenAI 硬件负责人 Richard Ho 的三条核心判断:

一、GPU 已经偏离 AI 负载本意。Transformer、agent、长上下文这些主流任务并非 GPU 设计初衷,继续被动接受英伟达节奏,模型再上量就触顶。OpenAI 因此 两年从零做到 tape-out(芯片设计完成交付流片),远超 Google TPU 当年三年的速度,关键是借助 Broadcom 的 IP 与制造,但架构与系统设计权牢牢留在内部。

二、为 6-9 个月后的模型设计硬件。HBM 高度选 8/12/16 层、互联铜线 2 米物理上限、推理与训练比例变化——所有决策都是面向"还没出现的模型"。这与 Nvidia 通用 GPU 路线根本不同,接近苹果做 M 系列的私域优化。

三、手机不是为 agent 设计的。今天的 iOS/Android 是 app-based、session-based,打开做完关闭;而 agent 需要在后台持续存在、跨任务调度、随时调用上下文,这要求 OS 级权限——苹果谷歌不会给。所以 OpenAI 必须自己做。这就解释了昨天爆出的 OpenAI 联手立讯 2028 量产手机一事,以及收购 Jony Ive 的 io 团队。

未来 OpenAI 硬件需求是 20GW,相当于十几到二十个核电站。Richard Ho 原话:"到这个规模,你必须谈电力,甚至国家安全。"

把这条路径与 Rabbit R1(套壳安卓+OpenAI API,失败)、Meta 雷朋眼镜(配角策略,200 万副但天花板低)、阿里千问眼镜(生态延伸)横向比较——OpenAI 是唯一一家在做"芯片+基建+OS+设备"全栈重写的公司。

同日,商汤开源 SenseNova U1(8B/A3B 两个版本),首次实现单模型连续图文输出——边推理边生图,文字逻辑走到哪图就跟到哪,无需调用外部工具。在 GPT Image 2 闭源涨潮的对岸,这是开源端目前最强的原生理解-生成统一模型,采用 NEO-unify 架构跳过传统视觉编码器(VE,把图像压缩成向量的中间层)。开源世界并未在视觉路线上彻底掉队。

主线三·GitHub 信任崩塌

HashiCorp 联合创始人 Mitchell Hashimoto 公开宣布将其终端项目 Ghostty 迁出 GitHub:"我连续一个月每天在日记上画 X,标记 GitHub 故障影响工作的日子,几乎天天画 X。"4 月 GitHub 实际可用率已跌破 85%。GitHub CTO Vlad Fedorov 当日发布道歉信,承认"agentic 工作流自 2025 年底加速,我们原本计划扩 10 倍容量,后来发现要 30 倍"。AI 智能体在背后狂刷 CI/CD,把全球开发者赖以为生的基础设施压垮了——这又是一条 AI 真实成本不在 token 而在系统层的证据。

快讯

欧盟正式推荐成员国部署开源年龄验证 App:基于护照/身份证注册,验证时不泄露任何个人信息,法、丹、希、意、西、塞、爱已计划集成进数字身份钱包。
朝鲜 APT 攻击升级:Zscaler 2026 VPN 风险报告显示,DPRK 利用 AI 在 npm 包中插入恶意代码,配合假公司+RAT(Remote Access Trojan,远程访问木马),把响应窗口压缩到极致。
苹果内部争论 MagSafe 是否保留:据微博爆料人,折叠 iPhone Ultra(4.5mm 厚)可能不带 MagSafe,标准款 iPhone 18 也在降本下被重新评估。
Framework RTX 5070 12GB 显卡模块卖 1199 美元,比 8GB 版贵 72%——GDDR7 短缺真传到了消费端,Framework 警告 8GB 版库存售罄后也将涨价。AYANEO 同日宣布全线掌机涨价,RAM 危机第七周持续。
PS5 Linux loader 开源发布:TheFlow 公开 ps5-linux 完整工具链,Phat 主机 3.xx-4.xx 固件可启动 Ubuntu 24.04,GTA V 增强版 4K 60fps 实测可玩。
Bambu Lab 用法律威胁关停 OrcaSlicer-BambuLab 分支:开发者 Pawel Jarczak 自愿删库,3D 打印生态围墙加速合拢。
Uber 上线酒店业务(对接 Expedia 70 万家酒店),CTO 称借助 Cursor 等 agent 工具开发周期缩短 50%。
Taylor Swift、Rihanna 深伪广告在 TikTok 推送奖励诈骗;英国调查显示 2/3 婴儿(<2 岁)看屏幕,部分日均 8 小时,远超官方"零屏幕"建议。

值得关注

OpenAI 与 Amazon 关系升温,Microsoft 法律风险被解除——AI 巨头供应链重排进入下一阶段。
FDA 给 Compass、Usona、Transcend 三款迷幻药(psilocybin、methylone)优先审批券,首款迷幻药或夏末获批。
Earth AI 自建矿物检测实验室,把样本周转从 5 个月压到 5 天——AI 发现矿后,瓶颈从模型转向物理供应链。
东京羽田机场试点中国 Unitree G1 / UBTECH Walker E 人形机器人搬行李(13,500 美元起),日航 2028 年前完成测试。

PODCAST SCRIPT

大家好，欢迎来到2026年4月29日的 YOMOO 每日AI快送。

我跟你说，今天有一条新闻特别反常识，而且不是从批评者嘴里说出来的，是硅谷自己人承认的。Nvidia 应用深度学习的副总裁，叫 Bryan Catanzaro，他直接对 Axios 说了这么一句话：对我团队来说，算力的成本远远超过了员工的成本。你想想，这话从全球卖铲子的英伟达副总裁嘴里说出来，分量就完全不一样了。

而且不是他一个人这么说。同一天，Uber 的 CTO Praveen Naga 也跟着表态，他说我得回到画板重新画预算，因为我原本想要的预算，两个礼拜前就花光了。还有更夸张的，Swan AI 的创始人在 LinkedIn 上直接晒出了一张 Anthropic 给他们开的月账单，11.3 万美元，团队一共四个人，人均每个月烧掉 2.8 万美元的 token，这数字早就远远超过他们自己发工资的钱了。

但是你知道最扎心的是什么吗？MIT 在 2024 年做过一份研究，结果发现，77% 的任务下，人类做事还是比 AI 做得更好。可是这些 CEO 们呢，丝毫不为所动，他们反而把这种高额账单当作自动化在进步的证据。黄仁勋甚至要求年薪 50 万美元的工程师，每年至少要消耗掉 25 万美元的 token。Naga 说得更直接，他说 CTO 这个职位以后要从软件工程师，转型成 AI 代理软件工程师。

听到这儿你可能觉得，钱花就花了，至少 AI 给的答案是靠谱的吧？我跟你说，今天还有第二条新闻，正好把这条经济叙事戳了个大窟窿。

刚发布的一份预印本研究做了这么一件事，他们拿了 13 张食物照片，分别向 GPT-5.4、Claude Sonnet 4.6、还有 Gemini 2.5 和 3.1 Pro 各发送了 500 多次，提示词一字不差完全相同，加起来一共问了 26904 次。结果你猜怎么着？同一张西班牙海鲜饭的照片，Gemini 2.5 Pro 估出来的碳水含量，从 55 克到 484 克之间反复横跳。

这个数字听起来好像没什么概念，但是你要是糖尿病人就吓死了。按照 1 比 10 的胰岛素碳水比换算，单独这一张照片问 2000 次，差距等于 42.9 个单位的胰岛素。42.9 单位是什么概念？足够引发严重的低血糖，甚至直接致死。

还有更讽刺的。一份 40 克的奶酪三明治，三个模型估出来一致是 28 克，精确地错了 12 克。Claude 是里面最稳定的，变异系数只有 2.4%，但是 Claude 给出 0.85 以上高置信度分数的时候，准确率反而比它低置信度的时候还要差。模型自己说我很有把握的那一刻，恰恰是它错得最离谱的时候。

所以你看，把这两条线索叠在一块儿，就是一个非常魔幻的画面。一边是企业愿意为不可靠的 token 付出比员工工资还高的钱，另一边是这些模型在一个有可能让人进 ICU 的场景下，连同样的问题问 500 次给出相近答案这件最基础的事都做不到。英国糖尿病技术网络早就声明了，通用大模型禁止用作胰岛素剂量自主咨询计算器，而这份预印本恰恰给出了量化证据。AI 经济叙事的真正脆弱点不是钱不够花，而是花出去的钱并不能买到对应的确定性。

说到这儿，咱们得说说今天另一条特别重要的内容，就是 OpenAI 到底在硬件上憋什么大招。极客公园披露了一份 Stanford 的闭门交流，OpenAI 硬件负责人 Richard Ho 第一次系统地讲出了三条核心判断。

第一条特别狠。他说 GPU 已经偏离了 AI 负载的本意。Transformer 也好，agent 也好，长上下文也好，这些主流任务根本不是 GPU 当年设计的初衷，再继续被动接受英伟达的节奏，模型一上量就到顶了。所以 OpenAI 怎么干的呢？两年时间从零做到 tape-out，就是芯片设计完成交付流片，远远超过 Google 当年做 TPU 用的三年。关键是他们借用了 Broadcom 的 IP 和制造能力，但是架构和系统设计权牢牢留在自己手里。

第二条更有意思。他说我们是为 6 到 9 个月后的模型设计硬件。HBM 高度选 8 层、12 层还是 16 层，互联铜线 2 米的物理上限，推理和训练比例怎么变化，所有这些决策都是面向那些还没出现的模型。这跟英伟达通用 GPU 的路线完全不一样，反而更接近苹果当年做 M 系列芯片的私域优化思路。

第三条最关键，直接解释了为什么 OpenAI 一定要自己做手机。Richard Ho 说，今天的 iOS 和安卓本质上是 app-based、session-based 的，打开 app，做完事情，关掉。但是 agent 不一样，agent 需要在后台持续存在，跨任务调度，随时调用上下文，这要求的是 OS 级的权限。苹果和谷歌会给吗？不可能给。所以 OpenAI 只能自己做。这就解释了昨天爆出的 OpenAI 联手立讯在 2028 年量产手机的事，也解释了为什么之前他们要花大价钱收购 Jony Ive 的 io 团队。

而且你知道未来 OpenAI 自己估算的硬件需求是多少吗？20 吉瓦。相当于十几到二十个核电站的发电量。Richard Ho 原话就是，到了这个规模你必须谈电力，甚至要谈国家安全。

我跟你说，把这条路径横向跟其他玩家比一比，画面就清楚了。Rabbit R1 套壳安卓加 OpenAI API，失败。Meta 雷朋眼镜走配角策略，卖了 200 万副但天花板很低。阿里千问眼镜是做生态延伸。OpenAI 是目前唯一一家在做芯片加基建加操作系统加设备这种全栈重写的公司。这就不是同一个量级的对抗了。

也是同一天，开源端也有一个动作。商汤开源了 SenseNova U1，分 8B 和 A3B 两个版本，第一次在单模型上实现了连续图文输出，就是边推理边生图，文字逻辑走到哪图就跟到哪，不需要调用外部工具。在 GPT Image 2 闭源继续涨潮的对岸，这是目前开源端最强的原生理解和生成统一模型，采用了 NEO-unify 架构，直接跳过传统的视觉编码器中间层。所以开源世界并没有在视觉这条路线上彻底掉队。

接下来还有一条，今天 GitHub 出大事了。HashiCorp 联合创始人 Mitchell Hashimoto 公开宣布，他要把自己的终端项目 Ghostty 迁出 GitHub。他说了一句特别戳心的话：我连续一个月每天在日记上画 X，标记 GitHub 故障影响工作的日子，几乎天天画 X。4 月份 GitHub 的实际可用率已经跌破 85% 了。

GitHub 的 CTO 当天就发布了道歉信，承认了一件事：agentic 工作流从 2025 年底开始加速，我们原本计划扩 10 倍容量，后来发现要扩 30 倍。听到这儿你应该明白了，是 AI 智能体在后台狂刷 CI/CD，把全球开发者赖以为生的基础设施给压垮了。这又是一条 AI 真实成本不在 token 而在系统层的证据。你不光要给模型付钱，你的底层基础设施都要为它重新扩容。

好，今天的快讯也挺密。欧盟正式推荐成员国部署开源年龄验证 App，基于护照和身份证注册，验证的时候不泄露任何个人信息，法国、丹麦、希腊、意大利、西班牙、塞浦路斯、爱尔兰已经计划集成进数字身份钱包了。朝鲜的 APT 攻击在升级，Zscaler 2026 VPN 风险报告显示，朝鲜正在利用 AI 在 npm 包里插入恶意代码，配合假公司加远程访问木马，把安全响应的窗口压到极致。苹果内部在争论 MagSafe 要不要保留，据爆料人说折叠 iPhone Ultra 因为只有 4.5 毫米厚可能不带 MagSafe，标准款 iPhone 18 也在降本下被重新评估。

硬件这边继续涨。Framework 的 RTX 5070 12GB 显卡模块卖 1199 美元，比 8GB 版贵了 72%，GDDR7 的短缺真的传到消费端了，Framework 警告 8GB 版库存售罄之后也要涨价。AYANEO 同一天宣布全线掌机涨价，RAM 危机已经持续到第七周了。PS5 Linux loader 也开源发布了，TheFlow 公开了完整工具链，Phat 主机 3.xx 到 4.xx 固件可以启动 Ubuntu 24.04，实测 GTA V 增强版能跑 4K 60 帧。Bambu Lab 用法律威胁关停了 OrcaSlicer 的 BambuLab 分支，开发者自愿删库，3D 打印生态围墙加速合拢。Uber 上线酒店业务对接 Expedia 70 万家酒店，CTO 说借助 Cursor 这些 agent 工具开发周期缩短了 50%。还有 Taylor Swift、Rihanna 的深伪广告在 TikTok 上推送奖励诈骗，英国调查显示三分之二两岁以下的婴儿看屏幕，部分日均 8 小时，远远超过官方零屏幕的建议。

最后几条值得长期关注的。OpenAI 跟 Amazon 关系在升温，微软的法律风险被解除，AI 巨头的供应链重排进入下一阶段。FDA 给三款迷幻药颁发了优先审批券，首款迷幻药可能在夏末就能获批。Earth AI 自建矿物检测实验室，把样本周转从 5 个月压缩到 5 天，AI 发现矿之后，瓶颈从模型转向了物理供应链。东京羽田机场在试点中国宇树 G1 和优必选 Walker E 人形机器人搬行李，13500 美元起售，日航打算 2028 年前完成测试。

所以总结今天最核心的一句话，AI 的经济和可靠性这两根支柱，今天被同一天撼动了。token 比员工还贵，可它给糖尿病患者算碳水能错出 42.9 个单位胰岛素的差距。OpenAI 看到了这层裂缝，所以他们要从芯片、基建、操作系统、一直到手机全栈重写，因为只有掌握了底层，才能让上层的不确定性收敛回来。GitHub 那场崩溃则告诉我们，AI 真正的账单不光写在 API 调用上，它写在每一层基础设施被迫重建的成本上。

如果你想通过阅读文字版更快地获取每日的 AI 快送信息，欢迎免费订阅我们的 mail list，地址在视频描述里。如果您觉得我们的节目对您有帮助，请帮忙分享、转发给您的朋友。好了，今天就到这里，我们明天见！