YOMOO 每日AI快送 — 2026年4月10日
今日速览
Anthropic发布史上最强模型Mythos却不敢公开,因其能自动发现并利用藏了20多年的零日漏洞,AI安全攻防格局正被彻底改写。与此同时,开源AI Agent赛道迎来新玩家Hermes,凭借"越用越聪明"的学习循环机制对OpenClaw发起正面挑战。网络安全方面,伊朗黑客趁美伊冲突对美国关键基础设施发动网络攻击,Google则推出硬件级会话绑定技术反击日益猖獗的cookie窃取。
重点专题:Anthropic的"奥本海默时刻"——最怕AI的公司造出了最危险的AI
此前我们报道过Anthropic发布RSP v3.0安全政策、内部文档泄露引发的安全对齐之争。如今事态升级到了一个全新维度——Anthropic发布了其最强模型Claude Mythos,但决定不对公众开放,原因令人震撼:这个模型能自动发现所有主流操作系统和浏览器中的"零日漏洞"(zero-day,即开发者发现漏洞时已可被利用、防御方准备时间为零的安全缺陷),并自主编写攻击代码。
Mythos的红队测试报告堪称近年AI安全领域最重磅的技术文档。它找到了OpenBSD中藏了27年的TCP协议漏洞、FFmpeg(几乎所有视频平台的底层解码库)中16年的解码器漏洞、FreeBSD内核中17年的远程代码执行漏洞等。这些bug之所以能隐藏如此之久,不是因为简单,恰恰是因为极其复杂——需要跨多个维度推理加精确触发条件的组合。
传统的Fuzzer(模糊测试器,给程序喂随机输入看会不会崩溃)只会"盲测",人类审计员则受限于数百万行代码的规模。Mythos的质变在于它第一次同时具备了"读懂代码语义提出假设"和"自主启动程序验证假设"的闭环能力。上一代Opus 4.6在自主漏洞利用测试中成功率接近0%,Mythos直接跳到181次——不是阶梯式提升,是平地起高楼。
更关键的是,Anthropic强调这些能力不是专门训练的结果,而是通用能力提升的"涌现"副产品。让模型更擅长修bug的同时,也让它更擅长利用bug。安全研究者Logan Graham提出了一个尖锐问题:全球大量关键基础设施运行在老旧代码上,过去的安全性依赖"攻击需要大量人力"这一前提——如果这个前提不再成立呢?
Anthropic牵头成立了Project Glasswing,让防御方先获得工具来修复漏洞。但这件事的深层矛盾在于:发现问题的公司恰恰是制造问题的公司。"这个模型强大到连我们自己都害怕"——这句话既是警告,也是广告。结合我们之前报道的量子计算可能于2029年破解主流加密,互联网的安全范式正面临多重夹击。
重点专题:Hermes Agent——会"做梦"的AI助手向OpenClaw宣战
此前我们持续关注AI代理的进化和OpenClaw生态。现在,一个叫Hermes的开源Agent框架正在GitHub上以4.8万Star的热度挑战OpenClaw的地位,其核心差异化在于一个理念:Agent用完之后不该什么都不留下。
Hermes内置了一套"学习循环"(Learning Loop)机制:每次任务完成后自动评估——工具调用超5次、中途出错后自修复、用户做过纠正——满足条件就自动生成可复用的Skill文件。技能不是一次写死,后续发现更好路径会用patch方式修改,只碰有问题的部分。
记忆系统分四层:常驻提示记忆(上限仅3575字符,故意收窄逼你筛选)、SQLite会话归档、按需加载的技能库、以及跨会话的用户建模层Honcho。还有一个"周期性微调"机制——在无用户输入时,系统自动向Agent发内部提示,要求回顾操作并决定什么值得保留。
小米大模型已宣布接入Hermes并提供两周限免。不过Hermes更像一套需要运维的基础设施,而非开箱即用的工具。如果你只想快速接个Telegram助手,OpenClaw仍然更简单;如果你期待三个月后的Agent和第一天不一样,Hermes值得关注。
快讯
伊朗黑客攻击美国关键基础设施: CISA联合FBI、NSA发布紧急警告,伊朗黑客针对美国水务和能源公司的PLC(可编程逻辑控制器,工业控制系统核心组件)发起攻击。这是美伊军事冲突的网络战延伸——此前我们报道过伊朗导弹摧毁AWS中东数据中心,现在战线已扩展到网络空间。
Google推出DBSC防cookie窃取: Chrome 146正式启用DBSC(Device Bound Session Credentials,设备绑定会话凭证),利用TPM安全芯片生成不可导出的密钥对,使被盗cookie快速失效。这是从"事后检测"到"主动预防"的范式转变。
DDR4价格出现首次回落: 16GB DDR4现货价从2200%的疯涨中首次下跌约5%至74.10美元。诱因之一是Google的TurboQuant内存压缩技术——号称能将大模型推理的内存占用减少6倍以上,引发囤积者抛售。但合约市场价格仍在攀升,消费者短期内难获实惠。
法国启动政府Linux桌面计划: 法国宣布DINUM将退出Windows转向Linux,并要求各部委在秋季前制定数字主权计划,涵盖工作站、协作工具、数据库、AI等领域。这是欧洲数字主权运动的标志性事件。
Meta AI索要你的健康数据: Meta新模型Muse Spark主动提示用户上传血压读数、血糖数据和化验报告,但这些数据不受HIPAA保护,可能被用于广告投放和模型训练。医学专家明确表示不会将自己的健康信息连接到此类服务。
科学家发明假病,AI信以为真: Nature报道研究人员虚构了一种名为"bixonimania"的疾病,多款主流AI聊天机器人在18个月内持续将其当作真实疾病向用户推荐,暴露了AI医疗建议的幻觉风险。
Z世代对AI又爱又恨: Gallup最新调查显示,仅18%的Z世代对AI持乐观态度,但多数人仍觉得不得不用。AI热情正在消退,怨气在上升。
值得关注
- 中国五部门发布《AI拟人化互动服务管理暂行办法》,禁止向第三方提供用户交互数据,同时支持算法、框架、芯片自主创新——AI监管框架持续完善
- Marimo RCE漏洞(CVE-2026-39987)披露仅10小时即遭利用,AI压缩了攻击响应窗口,远程访问成为最快突破口
- Artemis II今晚返回地球,太平洋时间下午5:07再入大气层,这是自阿波罗时代以来人类首次绕月载人飞行的收官时刻
- 包管理器分页难题:npm一个包的元数据可达37MB,但20年来无人加分页——因为依赖解析需要一次看到所有版本,CDN缓存优先于效率
大家好,欢迎来到2026年4月10日的 YOMOO 每日AI快送。
我跟你说,今天这条消息你一定要认真听。Anthropic,就是那个一直说自己最重视AI安全的公司,造出了一个它自己都害怕的模型。这个模型叫Claude Mythos,Anthropic已经决定不对公众开放。为什么?因为这个模型能自动发现操作系统和浏览器里藏了二十多年的零日漏洞,而且还能自己写攻击代码。
你想想这意味着什么。所谓零日漏洞,就是开发者发现的时候已经可以被利用了,防御方的准备时间是零。过去找这种漏洞,要么靠模糊测试器盲目地给程序喂随机数据看会不会崩溃,要么靠人类安全专家一行一行审计代码。几百万行代码,一个人看到退休都看不完。
但Mythos不一样。它的红队测试报告简直让人倒吸一口凉气。它找到了OpenBSD里藏了27年的TCP协议漏洞,FFmpeg里16年的解码器漏洞——你知道FFmpeg是什么吗?几乎所有视频平台底层用的解码库都是它。还有FreeBSD内核里17年的远程代码执行漏洞。这些bug不是简单的疏忽,恰恰相反,它们极其复杂,需要跨多个维度推理加上精确触发条件的组合,人类很难同时考虑这么多因素。
更恐怖的是跳跃幅度。上一代Opus 4.6在自主漏洞利用测试中成功率接近零,Mythos直接跳到181次。注意,这不是从10到20的线性提升,是从接近零到181,平地起高楼。
而且Anthropic强调,这些能力不是专门训练出来的,是通用能力提升的涌现副产品。你让模型更擅长修bug,它就同时更擅长利用bug。这就好比你教一个人开锁是为了当锁匠,结果他顺便也学会了撬锁。
安全研究者Logan Graham提了一个很尖锐的问题:全球大量关键基础设施跑在老旧代码上,过去觉得安全是因为攻击需要大量人力。如果这个前提不成立了呢?
Anthropic现在牵头成立了一个叫Project Glasswing的项目,让防御方先拿到工具去修漏洞。但你看这里面的矛盾——发现问题的公司恰恰是制造问题的公司。"这个模型强大到连我们自己都害怕",这句话你仔细品,它既是警告,也是广告。再加上我们之前报道过的量子计算可能在2029年破解主流加密,互联网的安全范式正在被多重夹击。
咱们说回AI工具这边。开源AI Agent赛道来了一个强劲的新玩家,叫Hermes。它在GitHub上已经拿到4.8万Star,正面挑战OpenClaw。
它的核心理念特别有意思:Agent用完之后不该什么都不留下。你想想看,现在大多数AI助手每次对话结束就失忆了,下次还得从头教。Hermes不是这样。它内置了一套学习循环机制,每次任务完成后自动评估——工具调用超过5次了吗?中途出错后自己修复了吗?用户做过纠正吗?满足条件就自动生成一个可复用的技能文件。而且技能不是一次写死的,后续发现更好的方法会用补丁方式修改,只动有问题的部分。
它的记忆系统分四层。最上面是常驻提示记忆,故意只给3575个字符的上限,逼你筛选最重要的信息。然后是SQLite会话归档,按需加载的技能库,以及跨会话的用户建模层Honcho。还有一个特别有趣的设计叫周期性微调——在没有用户输入的时候,系统自动给Agent发内部提示,让它回顾操作并决定什么值得保留。你可以理解为,这个Agent会在空闲时"做梦",整理白天学到的东西。
小米大模型已经宣布接入Hermes并提供两周限免。不过说实话,Hermes更像一套需要运维的基础设施,不是开箱即用的工具。如果你只想快速接个Telegram机器人,OpenClaw还是更简单。但如果你期待三个月后的Agent和第一天完全不一样,越用越聪明,Hermes值得关注。
接下来几条快讯,都很重要,咱们快速过一下。
网络安全方面,CISA联合FBI和NSA发布紧急警告,伊朗黑客正在攻击美国的水务和能源公司。攻击目标是PLC,也就是可编程逻辑控制器,工业控制系统的核心组件。这是美伊军事冲突从物理战场延伸到网络空间的标志。之前我们报道过伊朗导弹摧毁了AWS中东数据中心,现在战线又多了一条。
Google这边有个好消息。Chrome 146正式启用了一项叫DBSC的技术,全称是设备绑定会话凭证。简单说就是利用你电脑里的TPM安全芯片生成一对密钥,这个密钥没法导出。以后就算黑客偷了你的cookie也没用,因为cookie和你的物理设备绑定了。这是从事后检测到主动预防的转变,对付cookie窃取非常关键。
内存市场出现拐点。16GB DDR4现货价从之前疯涨2200%的高位首次回落,跌了大约5%到74美元。导火索之一是Google发布了一项叫TurboQuant的内存压缩技术,号称能把大模型推理的内存占用减少6倍以上。这个消息一出,囤积者开始抛售。不过合约市场价格还在涨,消费者短期内别抱太大希望。
法国宣布政府要退出Windows转向Linux了。要求各部委在秋季前制定数字主权计划,涵盖工作站、协作工具、数据库、AI各个领域。这是欧洲数字主权运动的一个标志性事件。
Meta这边又搞事情。它的新模型Muse Spark主动提示用户上传血压、血糖、化验报告。注意,这些健康数据不受HIPAA保护,可能被用来打广告和训练模型。医学专家已经明确表示不会把自己的健康信息连到这种服务上。
最后这条特别有意思。Nature报道,科学家故意虚构了一种叫bixonimania的假病。结果呢,多款主流AI聊天机器人在长达18个月的时间里,一直把它当成真实疾病推荐给用户。这件事再次提醒我们,AI给的医疗建议要打一个大大的问号。
再说几个值得持续关注的动向。中国五部门发布了AI拟人化互动服务管理暂行办法,禁止向第三方提供用户交互数据,同时支持算法、框架、芯片的自主创新,AI监管在持续完善。还有一个Python笔记本工具Marimo被披露了远程代码执行漏洞,从漏洞公开到被利用只用了10个小时,AI正在压缩攻击者的响应窗口。另外Artemis II今晚返回地球,这是阿波罗时代以来人类首次绕月载人飞行的收官时刻,也值得关注。
所以你看,从Anthropic造出自己都害怕的模型,到Hermes让Agent越用越聪明,再到伊朗黑客的网络攻击和Google的硬件级防御,AI正在同时改写攻防两端的规则。最让人深思的或许是Mythos的启示——让AI变强和让AI变危险,可能本质上是同一件事。
如果你想通过阅读文字版更快地获取每日的AI快送信息,欢迎免费订阅我们的mail list,地址在视频描述里。如果您觉得我们的节目对您有帮助,请帮忙分享、转发给您的朋友。好了,今天就到这里,我们明天见!