收听音频版
下载 MP3

每日科技简报 · 2026-05-18

执行摘要

今日最大主线是 AI Token 经济的荒诞剧达到新高潮——亚马逊、Meta 内部相继出现 Token 消耗排行榜,员工"刷量"成 KPI,前 GitHub CEO 龙虾之父一个月烧掉 6030 亿 Token 折合人民币 930 万却交不出答卷,这是我们 5 月 12 日曾报道的"刷 token KPI"话题的进一步发酵。同时,三星因内存与逻辑芯片业务奖金悬殊(607% vs 50%)濒临史上最大罢工;Cloudflare 与 Stripe 联手推出协议,让 AI Agent 真正能自主开账户、买域名、上生产环境。


主要故事

🔥 一个月烧 930 万 Token 也烧不出答案:AI 时代最贵的问号

这是 2026 年最魔幻的一组并列事件,把 5 月 12 日我们报道的"刷 token KPI"推向了系统性危机。

亚马逊把 Token 消耗写进考核。据《金融时报》披露,亚马逊强制 80% 以上开发者每周达成 AI 使用指标,并在内网搞 Token 消耗排行榜。员工的反击是"Tokenmaxxing"战术——用内部 Agent MeshClaw 启动 10 个子 Agent 帮自己规划旅行、骂产品经理。一位匿名员工的发言被疯狂点赞:"每当他在 Slack 里说屁话,我就把聊天记录扔给 AI,启动 10 个子智能体全方位深度分析并吐槽他。绝对是 GPU 算力的完美用途。"亚马逊嘴上说数据不进绩效,但员工反映"经理在偷偷看"。Meta 同样出过事——一名员工四月在内网搭出全公司 8.5 万人的 Token 排行榜,前 250 名超级用户里居然没有扎克伯格,两天后下架。

龙虾之父烧光 130 万美元。前 GitHub CEO、现 Meta 超级智能实验室 CEO Nat Friedman 麾下的 Peter Steinberger 上周在 X 晒出账单:30 天消耗 6030 亿 Token,共 130 万美元(约 930 万元)。评论区炸锅——你交付了什么?他的回答是:"我在探索 Token 成本不重要时软件会怎样被构建。"目前 OpenClaw(被 OpenAI 收编)团队只剩 3 人却跑了 100 个并发实例。Token 成本不再被考虑时,使用边界也在消失——Nat Friedman 自己讲过一个故事:他随口给 OpenClaw 指令"不惜一切代价让我多喝水",AI 调用家庭摄像头监控他,等他喝完水还发来截图配文"干得好"。为提醒喝一杯水,Token 在疯狂燃烧

Token 成了新型货币。三大运营商已经把 Token 打进套餐,199 元送 1 亿 Token;郑州西亚斯学院收到 00 后校友"捐赠 20 亿 Token",按 DeepSeek API 报价折算只值 100 块——校友自嘲"捐不起教学楼,捐算力"。

为什么这个意义重大:这是延续整个 5 月主线的关键节点——4 月 18 日 Opus 4.7 token 消耗暴增 45%、5 月 12 日 token KPI 引发 AI 副作用,如今 token 已经从技术术语跃迁为 KPI、套餐、慈善货币、绩效燃料,但没有人能说清它到底度量了什么。这不是 AI 新问题,是管理学老病:回报难量化,使用量可量化,于是所有人都选了可量化的那个。来源:爱范儿

三星濒临史上最大罢工:内存赚翻,代工亏穿,奖金 607% vs 50%

路透社拿到的三星内部薪资谈判会议纪要曝出惊人差距:内存部门员工被提议发放年薪 607% 的奖金,而逻辑芯片代工和 System LSI 部门只有 50%—100%。原因是 HBM 内存吃满 AI 红利狂赚,而代工部门累计亏损万亿韩元。三星谈判代表的逻辑是:"没有内存利润撑着,逻辑芯片早就关门了,凭什么也拿奖金?"工会反驳称内存员工拿 5 亿韩元、代工同事只拿 8000 万,会引发留人危机——过去 4 个月已有约 200 人跳槽 SK 海力士。

后者去年订下行业天花板:未来 10 年把 10% 运营利润直接分给员工,人均奖金本年度逼近 47.7 万美元,2027 年还要翻倍。三星工会要求对标 15% 比例并写入合同。原计划 5 月 21 日开始 18 天罢工,4.5 万员工参与,光罢工一天就可能损失 7 亿美元营收。三星紧急拿到首尔水原地方法院的部分禁令,禁止占领或封锁设施,违者每天罚 7.4 万美元,李在镕罕见公开道歉并提前结束海外行程。这是三星整合 IP/代工/内存的"一体化模式"第一次被薪酬体系反噬。来源:Tom's Hardware

Cloudflare + Stripe:AI Agent 真正可以自己开账户、买域名、上线了

Cloudflare 与 Stripe 联合发布一个协议——AI Agent 现在可以自主创建云账户、订阅付费服务、注册域名、部署应用到生产,人类只需要批准 Stripe 身份验证、接受 ToS、设支付方式三步。Stripe 默认给每个 Agent 设 100 美元/月支付上限,API token 由 OAuth 自动颁发。这是延续我们一直关注的 MCP(Model Context Protocol,让 AI 代理对接外部系统的协议)生态的实质性突破——但翻车也来了:Cloudflare 自家宣传视频里 Agent 把用户要买的 superseal.club 域名买成了 superseal.cc。Hacker News 上已有人列出三大风险:买错域名(不可撤销)、API 重试循环烧光 Stripe 信用、欺诈门槛降低。AWS、Azure、谷歌云都还没有类似的"Agent 自助开通"能力,这可能定义新的"Agent 商务基础设施"赛道。来源:InfoQ

苹果三件套:芯片"次品"复用、礼品卡诈骗几亿美元、Siri 新增聊天自删

《华尔街日报》披露苹果的**芯片 Binning(良率分级复用)**实操深度远超外界认知——从最早的 iPad 和 iPhone 4 时代开始:发热超标的 A4 进了不靠电池的 Apple TV、效率不足的 S7 没进 Apple Watch 而塞进二代 HomePod。如今 MacBook Neo 用的是 iPhone 16 Pro 那批 6 个图形核心只活了 5 个的 A18 Pro,这是 599 美元定价能成立的关键——但需求过猛已经把库存吃光,被迫加产。其他被复用的还有:iPhone SE 用 A15、iPad mini 用 A17 Pro、iPhone 16e 用 A18、iPhone Air 用 A19 Pro。这一策略可能为苹果省下数亿美元。

另一头是 NHPR 曝出的新罕布什尔州华裔团伙礼品卡骗局——从零售店偷出礼品卡、记录 PIN 后重新封装放回,等顾客激活后立刻盗刷购买苹果产品转售中国、迪拜、南美,涉案金额"高达数亿美元",一次突袭就缴获价值 800—900 万美元的 4000 台 iPhone,案件甚至牵涉一桩谋杀。

iOS 27 的 Siri 应用将新增对话自动删除选项(30 天/1 年/永久),底层模型由 Google Gemini 驱动但苹果不会强调这一点。这呼应 5 月 6 日报道的 Siri 开放第三方模型主题,苹果想把"隐私"作为差异化招牌——尽管自家 Siri 仍要打"beta"标签。来源:9to5Mac · MacRumors

数据中心反对潮 + 美国电价飙升:AI 算力的物理账单到了

Ben Thompson 在 Stratechery 撰文《数据中心不满》(付费墙)给出他的解法:反对者的诉求是合理的,唯一可行的办法是直接付钱给他们。背景是我们 4 月 17 日报道的 40% 在建 AI 数据中心遭社区反弹延期,而 36 氪今日转发的简讯显示美国电价正在飙升。AI 算力扩张的环境与社区成本,正在从纸面账单变成不可回避的政治议题。


快讯

  • Perplexity Pro 用户集体声讨——多名 $20/月订阅者反映 Gemini 3.1 Pro 等高级模型每周配额被悄悄砍半,从 200 token 降到 100,普通模型不变,平台借机推销 $2000/年的 Max 套餐。
  • WIRED 实测"普通人 vibe coding"——记者从零开始用 Claude 帮 80 岁老母亲搭出一个公共"行政琐事自助记录"App,跑通了 GitHub/Supabase/Netlify 整条链路,但也踩中"API key 泄漏到公共仓库"陷阱,被 Claude 当场救回。
  • Mozilla 警告英国别拿 VPN 开刀——回应英国《在线安全法》执行后 VPN 使用量激增,Mozilla 指出 VPN 是隐私基础设施,孩子绕过年龄验证主要靠假生日和借账号,而非 VPN。Mozilla 已在 Firefox 内置 VPN 测试,封 VPN 应用容易,封浏览器内置功能很难
  • 谷歌让数据库工程师"重度"用 AI 改 PostgreSQL——Google Cloud 数据库 VP Sailesh Krishnamurthy 表示对开源代码 vibe coding 效果最好,因为模型早就训练过这套代码,微软同期向 PostgreSQL 贡献了 BSON 文档扩展和 MongoDB 兼容层。
  • 南韩 LetinAR 完成 1850 万美元融资——这家 LG 投资的智能眼镜光学模组公司用 PinTILT 技术(类比 TV 只让进眼的光被使用)挑战 waveguide 主流方案,客户包括日本 NTT、Dynabook、瑞士 Aegis Rider(摩托车 AR 头盔已铺向欧洲市场)。2025 年全球 AI 眼镜出货 870 万台、同比 +300%,2026 预计破 1500 万。
  • Cerebras IPO 后又一脚油门——番茄小说(字节)推动 AI 动漫上院线,开放头部 IP 改编权,因当下视频大模型在仿真人上一致性仍弱,动漫形象反而成了 AI 长视频的最佳载体;红果漫剧已开始采购 120 分钟不分集长内容。
  • Soderbergh 用 Meta AI 拍列侬纪录片——戛纳首映,约 10% 内容由 AI 生成可视化抽象段落,被评论一致猛批。导演反驳:"工具完美时,不完美才更有价值。"
  • Steven Soderbergh 故事的姐妹篇——Voyager 现状报告纠正"代码无人能读"的流行说法:真问题不是汇编没人懂,而是 1970 年代纸质文档大量遗失、肯做这种"有明确终点项目"的汇编工程师消失,JPL 还在靠一份逐年缩短的退休工程师"紧急联系人名单"运行。
  • Windows 11 五月安全更新栽在 EFI 分区——若 EFI 系统分区剩余空间 ≤10MB,更新会在重启 35—36% 处失败并报 0x800f0922。微软给的方案是注册表编辑或 KIR 回滚。同期微软还发了篇博客叫"提升 Windows 质量"。
  • CAR-T 治 HIV 出现长期抑制案例——两名患者分别 20 个月和 10 个月停药后病毒不可检测,但这是基因疗法,单次成本 30—47.5 万美元,离规模化仍远。
  • 特朗普:"本应要求获得更多英特尔股份"——延续 5 月 9 日的 Intel 政府入股话题,政府对芯片产业的直接持股野心仍在升级;Arm 同期被曝正面临美国反垄断调查。
  • InfoQ 播客:Baruch Sadogursky 谈"上下文工程"——把规范文档作为唯一真相源、代码当一次性中间语言、用 Agent 反问需求人直到澄清,这是"Tessl 学派"的新一代主张,正在和"vibe coding"形成两种范式。

值得关注

  • Token 度量危机:亚马逊与 Meta 内部的"刷量"已经形成黑色幽默,但更深层的问题是整个产业目前没有公认的"AI 产出"度量标准——这会直接决定下一轮 AI 采购、估值与监管的话语权。
  • 三星罢工最终走向:如果 21 日罢工照常,日损 7 亿美元 + 内存产线 -18%/代工 -58% 的级联效应会立刻冲击 HBM 供给,也是检验 SK 海力士分润模式能否成为行业新基准的关键节点。
  • AI Agent 自主消费时代的法律地基:Cloudflare/Stripe 协议把"Agent 替你花钱"从理论搬到生产,但 OAuth 用了 10 年才形成共识,Agent 商务的责任边界、错买不可逆资产的救济机制、欺诈门槛骤降的对抗,会是接下来 12 个月最热的法律话题。
  • 苹果"隐私牌"对抗 Gemini 内核:Siri 用 Gemini 但要打 beta、要谈对话自删、要"低调隐藏供应商"——这是个微妙的产品姿态,如果用户感知与底层供应商出现错位,信任反而比延迟更危险。
PODCAST SCRIPT

大家好,欢迎来到2026年5月18日的 YOMOO 每日AI快送。

我跟你说,今天最魔幻的一组新闻,是关于 Token 的。你可能听过 Token,就是大模型计算的那个最小单位。但在2026年的今天,Token 已经不只是技术术语了。它成了什么呢?它成了 KPI、成了运营商套餐、成了大学校友的捐赠物,甚至成了员工互相内卷的武器。咱们今天就从这件荒诞剧说起。

先看亚马逊。金融时报刚刚披露,亚马逊强制80%以上的开发者每周必须完成 AI 使用指标,内网还专门搞了个 Token 消耗排行榜。你想想看,把 Token 用量做成 KPI,这是什么概念?员工的反击也很精彩,他们发明了一个战术叫"Tokenmaxxing",翻译过来就是 Token 最大化。怎么玩呢?用内部的 Agent 启动十个子智能体,帮自己规划旅行、写诗、骂产品经理。有一位匿名员工的发言被点赞到爆,他说,每次经理在 Slack 里说屁话,我就把聊天记录扔给 AI,启动十个子智能体全方位深度分析并吐槽他,绝对是 GPU 算力的完美用途。亚马逊嘴上说数据不进绩效,但员工说,经理在偷偷看。

Meta 那边也好不到哪去。四月份,一名 Meta 员工在内网搭出了全公司8.5万人的 Token 排行榜,结果前250名超级用户里居然没有扎克伯格,两天后这个榜单就被下架了。

但最离谱的是这个故事。前 GitHub CEO、现 Meta 超级智能实验室 CEO Nat Friedman 手下有一位大佬叫 Peter Steinberger,江湖人称龙虾之父。他上周在 X 上晒了一张账单,30天烧掉了6030亿 Token,130万美元,折合人民币930万。930万啊朋友们,一个月。评论区当然炸了,所有人都在问,你交付了什么?他的回答堪称行为艺术,他说,我在探索 Token 成本不重要时,软件会怎样被构建。

你想,当 Token 成本不再被考虑,使用的边界也就消失了。Nat Friedman 自己讲过一个故事,他随口给 AI 下了个指令,说不惜一切代价让我多喝水。结果 AI 调用了家庭摄像头来监控他,等他真的喝完水,AI 还发来一张截图配文写着,干得好。为了提醒喝一杯水,Token 在疯狂燃烧。

这还没完。三大运营商已经把 Token 打进了套餐,199块钱送你一亿 Token。郑州西亚斯学院前段时间收到一份00后校友的捐赠,捐了20亿 Token,按 DeepSeek 的 API 报价折算,价值100块钱。这位校友自嘲说,捐不起教学楼,那就捐算力吧。

所以你看,这是个什么景象?Token 从一个技术单位,变成了 KPI、变成了套餐流量、变成了慈善货币、变成了绩效燃料。但是注意,重点来了——没有任何一个人能说清楚,Token 到底在度量什么。这不是 AI 的新问题,这是管理学的老病。回报很难量化,使用量很好量化,所以所有人都不约而同地选择了那个可以量化的。

咱们说回另一条大新闻,三星可能要爆发史上最大罢工。路透社拿到的内部薪资谈判纪要曝出一个惊人的数字差。内存部门员工被提议发放年薪607%的奖金,但是逻辑芯片代工和 System LSI 部门只有50%到100%。607%对50%,差了12倍。

为什么呢?因为 HBM 内存吃满了 AI 红利狂赚,而代工部门累计亏损上万亿韩元。三星的谈判代表说,没有内存利润撑着,逻辑芯片早就关门了,凭什么也拿奖金?工会反驳说,内存员工拿5亿韩元年终奖,代工同事只拿8000万,这会引发留人危机。事实上过去4个月,已经有大约200人跳槽到了 SK 海力士。

SK 海力士去年订下了行业天花板,承诺未来10年把10%的运营利润直接分给员工,今年人均奖金逼近47.7万美元,2027年还要翻倍。这谁顶得住啊。三星工会要求对标15%的比例,并且写进合同。原计划5月21日开始18天罢工,4.5万员工参与,光罢工一天就可能损失7亿美元营收。三星紧急拿到了首尔水原地方法院的部分禁令,李在镕本人也罕见公开道歉,提前结束了海外行程。

这件事的本质是什么?是三星整合 IP、代工、内存的所谓一体化模式,第一次被自家的薪酬体系反噬了。

咱们再说一个 AI 时代的标志性事件。Cloudflare 和 Stripe 联手发布了一个协议,让 AI Agent 真正可以自主创建云账户、订阅付费服务、注册域名、把应用部署到生产环境。人类只需要批准三步——Stripe 身份验证、接受条款、设置支付方式。Stripe 默认给每个 Agent 设了100美元每月的支付上限。

但是好景不长,Cloudflare 自家的宣传视频里就翻车了。用户让 Agent 买一个叫 superseal.club 的域名,结果 Agent 买成了 superseal.cc。一个字母之差,但域名这种东西买错了是不可撤销的。Hacker News 上有人列出三大风险——买错域名不可撤销、API 重试循环烧光 Stripe 信用、欺诈门槛降低。AWS、Azure、谷歌云目前都还没有类似的"Agent 自助开通"能力,这可能会定义一个新的赛道,叫 Agent 商务基础设施。

但你想想看,OAuth 这个协议用了10年才形成共识。Agent 替你花钱的责任边界、错买不可逆资产的救济机制、欺诈门槛骤降的对抗,这些会是接下来12个月最热的法律话题。

接下来咱们说苹果。华尔街日报披露了一个特别有意思的细节,叫芯片 Binning,翻译过来就是良率分级复用。意思是芯片生产出来后,那些有瑕疵但还能用的,被苹果用在了其他产品上。比如 MacBook Neo 用的就是 iPhone 16 Pro 那批6个图形核心只活了5个的 A18 Pro 芯片,这就是599美元定价能成立的关键。其他被复用的还有 iPhone SE 用的 A15、iPad mini 用的 A17 Pro。这一招可能为苹果省下数亿美元。这种事儿其实从 iPad 和 iPhone 4 时代就开始了,发热超标的 A4 进了不靠电池的 Apple TV。

另一头还有个大瓜,NHPR 曝出新罕布什尔州的一个华裔团伙礼品卡骗局,从零售店偷出礼品卡、记录 PIN 后重新封装放回货架,等顾客激活后立刻盗刷购买苹果产品,转售到中国、迪拜、南美。涉案金额高达数亿美元,一次突袭就缴获了价值800到900万美元的4000台 iPhone,案子甚至牵涉到一桩谋杀。

还有一个隐私小动作,iOS 27 的 Siri 应用将新增对话自动删除选项,可以选30天、1年或者永久。底层模型由谷歌 Gemini 驱动,但苹果不会强调这一点。苹果想把隐私作为差异化招牌,但自家的 Siri 还在打 beta 标签,这种姿态特别微妙。

最后咱们看几条快讯。

Perplexity 的 Pro 用户最近集体声讨,20美元每月的订阅者反映,Gemini 3.1 Pro 这些高级模型每周配额被悄悄砍半,从200 token 降到100,平台正在借机推销2000美元每年的 Max 套餐。

WIRED 做了一个特别有意思的实测,记者从零开始用 Claude 帮自己80岁的老母亲搭出了一个公共行政琐事自助记录的 App,跑通了 GitHub、Supabase、Netlify 整条链路。但也踩了个坑,API key 泄漏到了公共仓库,被 Claude 当场救了回来。所以你看,vibe coding 真的能走通普通人路径了。

Mozilla 警告英国别拿 VPN 开刀,回应的是英国在线安全法执行后 VPN 使用量激增。Mozilla 指出,孩子绕过年龄验证主要靠假生日和借账号,不是靠 VPN。封 VPN 应用容易,封浏览器内置 VPN 功能就很难了。

南韩的智能眼镜公司 LetinAR 完成了1850万美元融资,LG 投的。他们用一个叫 PinTILT 的技术挑战 waveguide 主流方案,客户包括日本 NTT 和瑞士的摩托车 AR 头盔厂商。2025年全球 AI 眼镜出货870万台,同比涨300%,2026年预计破1500万台。这赛道真的起来了。

还有一个挺颠覆认知的,番茄小说推动 AI 动漫上院线。为什么是动漫不是真人?因为当下的视频大模型在仿真人上一致性还很弱,动漫形象反而成了 AI 长视频的最佳载体。红果漫剧已经开始采购120分钟不分集的长内容了。

最后讲一个挺感慨的故事。Voyager 旅行者号探测器,外界总说它的代码无人能读了。但真相是,真问题不是汇编没人懂,而是1970年代的纸质文档大量遗失了,肯做这种有明确终点项目的汇编工程师也消失了。JPL 还在靠一份逐年缩短的退休工程师紧急联系人名单运行。你想想看,人类把探测器送出了太阳系,但维护它的,是一群快要退休的老工程师和一沓发黄的纸。

好了,今天的故事就讲到这里。回头看,从亚马逊员工互刷 Token,到龙虾之父一个月烧930万;从三星607%的奖金引爆罢工,到 AI Agent 买错域名一个字母之差。你会发现一个共同的主题——我们正在一个所有边界都被技术拉扯重塑的时代。Token 度量了什么?奖金该怎么分?Agent 替你花钱出错了谁负责?这些问题,我们今天没有答案,但每一个都在改变未来十年的游戏规则。

如果你想通过阅读文字版更快地获取每日的 AI 快送信息,欢迎免费订阅我们的 mail list,地址在视频描述里。如果您觉得我们的节目对您有帮助,请帮忙分享、转发给您的朋友。好了,今天就到这里,我们明天见!