每日技术简报 — 2026年3月20日

执行摘要

今日最重磅内容是数学家陶哲轩（Terence Tao）与Dwarkesh Patel的深度对话，探讨AI在科学发现中的角色与局限，提出"人工巧思"与"人工智能"的关键区分。与此同时，多篇文章从不同角度反思AI热潮——从开发者实际体验到创业公司的短命周期，一股"慢下来思考"的思潮正在技术社区酝酿。此外，Google被曝用AI擅自改写搜索结果中的新闻标题，引发媒体强烈反弹。

主要报道

陶哲轩论AI与科学发现：广度惊人，深度不足

这是本日最值得深读的内容。陶哲轩在Dwarkesh Podcast中以开普勒发现行星运动定律的故事为切入点，系统阐述了AI对数学和科学研究的影响。

核心洞察：AI擅长广度，人类擅长深度。 陶哲轩指出，AI已将"想法生成"的成本降至接近零——正如互联网将通信成本降至接近零。但这并未自动创造丰裕，瓶颈转移到了验证、评估和判断哪些想法真正推动学科前进。

他分享了一个关键数据：在Erdős问题库中，AI辅助解决了约50个问题，但系统性研究显示，AI对任何给定问题的成功率仅约1%-2%。"如果你只关注社交媒体上广播的成功案例，看起来令人惊叹。但做系统性研究时，你会看到真实的成功率。"

陶哲轩提出了"人工巧思"（Artificial Cleverness）与"人工智能"（Artificial Intelligence）的区分。他描述与人类合作者解决问题时的过程——持续适应、累积改进、从部分进展中构建。而AI目前更像是"跳跃机器人"，能跳得比人高，但无法在中途找到落脚点、停留、再从那里出发。"它们缺乏从部分进展中累积构建的能力。"

对个人生产力的诚实评估也很有价值。陶哲轩坦言，AI让他的论文变得更丰富（更多代码、图表、文献综述），但核心数学突破仍靠纸笔完成。"论文更丰富、更广泛，但不一定更深入。"

此前我们报道过AI规模扩张遭遇瓶颈（3月15-16日），Altman承认纯规模扩张无法通向AGI。陶哲轩的观察从实践层面印证了这一判断：当前AI的能力边界不在于规模，而在于缺少某种我们尚未理解的"累积推理"机制。

为何重要： 来自顶级数学家的一手体验报告，比任何基准测试都更能说明AI的真实能力边界。他对"人机混合将长期主导数学研究"的预判，值得所有AI应用领域的从业者参考。

来源：Dwarkesh Podcast

"慢思考"反潮流：多位技术人反思AI速度崇拜

今日出现了罕见的集体反思现象，多篇独立文章从不同角度质疑"一切都要更快"的AI叙事。

Armin Ronacher（Flask框架作者）在"Some Things Just Take Time"中用种树做比喻：50年的橡树无法批量生产，信任、质量和社区也不会从一个周末冲刺中凭空出现。他观察到最近一批YC创业公司"连告别都没说就消失了"，以及大量开源项目只有一周的提交记录就被遗弃。他特别指出一个悖论：所有人都说AI节省时间，但所有深度使用AI的人似乎时间反而更少了——"省下的时间立刻被竞争吞噬。"

Dave Rupert和Jim Nielsen讨论了"人不是摩擦力"这一主题。AI对每个学科的暗示是：别人的工作很简单，只有你的工作才真正重要。"AI在我们耳边低语：除了你，其他人的工作都很容易。" Paul Ford的话被引用："生活中最残酷的事实是，你热爱的学科离开你鄙视的其他学科就毫无意义。"

Terence Eden则从个人角度表示："被落下我完全没问题。"他将当前AI热潮与早期加密货币的FOMO（错失恐惧）策略类比——如果这项技术真如宣传的那样好，他可以在自己选择的时间节点加入。

为何重要： 这不是反技术的声音，而是来自技术社区核心人物的冷静思考。当Flask作者、知名博主们同时发出"慢下来"的信号时，值得注意这是否代表了一种更广泛的情绪转向。

来源：Armin Ronacher、Jim Nielsen、Terence Eden

Google用AI改写搜索标题，媒体震怒

The Verge报道，Google搜索正在实验性地用AI重写网页标题。一个案例中，The Verge的标题"I used the 'cheat on everything' AI tool and it didn't help me cheat on anything"被缩减为五个词："'Cheat on everything' AI tool"——几乎像在为该产品背书。Google称这是"小范围、狭窄的实验"，但拒绝透露实验规模，且该做法已扩展到新闻以外的网站。

John Gruber评论称这已远超"跳过鲨鱼"的程度，是"彻底迷失方向"。

为何重要： 这触及了信息生态的根基——当搜索引擎可以在不标注的情况下改写你说过的话时，信息源的可信度将从根本上被侵蚀。

来源：The Verge via Daring Fireball

Cursor的Composer 2基于中国AI模型Kimi K2.5构建

Kimi.ai证实，Cursor的新版Composer 2以Kimi-k2.5作为基础模型，通过Fireworks AI平台进行授权商业合作。Cursor在此基础上进行了持续预训练和高算力强化学习。这是开源模型生态的一个重要案例——中国AI实验室的模型通过商业合作进入主流开发者工具。

来源：Simon Willison

快讯

Adobe深度批评文：Ed Zitron发布长文详细剖析Adobe的商业模式——隐藏的年度合同、50%提前终止费、产品内广告。此前我们报道的SaaS危机（3月14日）在Adobe身上体现得淋漓尽致。DOJ的1.5亿美元和解金仅占Adobe两年收入的0.345%。(来源)
包管理器镜像全景调查：Andrew Nesbitt系统梳理了15+软件生态的镜像工具和协议，从Debian的成熟两阶段rsync到npm的CouchDB兼容API崩溃。此前我们报道的供应链安全话题（3月8日、17日）的基础设施层面。(来源)
Turbo Pascal 3.02A反编译：Simon Willison用Claude反编译了1985年39,731字节的Turbo Pascal可执行文件——包含完整文本编辑器IDE和Pascal编译器。一个AI实用能力的精彩小案例。(来源)
Firefox Nova UI争议：新设计将标签页、地址栏和内容窗口完全视觉分离，违反了"相关元素应看起来相关"的基本设计原则。(来源)
Google Android侧载新限制：未经Google验证的应用安装将需24小时等待期。Gruber讽刺道：Tim Sweeney拿了一袋现金，同意Google在Android上的任何做法到2032年前都是"促进竞争的"。(来源)

值得关注

AI科学研究的"广度优先"范式：陶哲轩提出的"重新设计科学方式以利用AI的广度能力"值得持续关注。他预见一种全新的科学模式——先用AI大规模探测，再由人类专家深入攻坚。
开发者工具的模型层竞争：Cursor选择Kimi K2.5而非GPT或Claude作为基础模型，暗示AI编程工具的竞争正在向模型供应链层面延伸。此前OpenAI收购Astral（3月19日）争夺开发者工具链控制权，现在模型本身也成了争夺焦点。
"技术减速"思潮：从Armin Ronacher到Terence Eden，从Ibrahim Diallo到Dave Rupert，越来越多有影响力的技术人开始公开质疑速度崇拜。这不是反AI，而是要求更诚实地面对AI的实际价值与局限。

PODCAST SCRIPT

大家好，欢迎来到2026年3月20日的 YOMOO 每日AI快送。

今天我跟你说一个特别有意思的事儿。全世界最顶尖的数学家之一，菲尔兹奖得主陶哲轩，他每天都在用AI做研究。你猜他怎么评价AI？他说，AI确实让他的论文变得更丰富了，更多代码、更多图表、更多文献综述。但是，真正的数学突破呢？还是靠纸和笔。你听听，这可不是什么AI怀疑论者说的话，这是一个深度使用AI的顶级科学家的一手体验。

陶哲轩在Dwarkesh Podcast上做了一期非常深入的对话，他提出了一个我觉得特别精妙的区分。他说，我们现在拥有的不是"人工智能"，而是"人工巧思"，英文叫Artificial Cleverness。什么意思呢？他打了个比方，说AI就像一个弹跳力超强的机器人，能一下子跳得比任何人都高。但问题是，它没法在半空中找到一个落脚点，停下来，喘口气，然后从那个位置再往上跳。换句话说，AI缺少一种从部分进展中不断累积、不断构建的能力。

你想想看，这其实就是人类科学家做研究的方式对吧？你先有一个不完美的想法，试一试，发现走不通，但是你从那个失败里学到了什么，调整方向，再往前走一步。就这样一步一步地，最终到达一个全新的发现。AI做不到这个。它要么一步跳到终点，要么就摔下来从头再来。

他还给了一个特别有说服力的数据。他说在一个叫Erdős问题库的数学难题集合里，AI辅助解决了大概50个问题，听起来很厉害对吧？但是你做系统性研究的时候就会发现，AI对任何一个给定问题的成功率只有百分之一到百分之二。百分之一到百分之二啊。你在社交媒体上看到的全是那些成功的案例，所以你觉得AI简直无所不能。但真实的成功率，远没有那么夸张。

这个观察其实和我们之前聊过的一个趋势完全吻合。上周Altman自己都承认了，纯粹靠规模扩张是到不了AGI的。陶哲轩从数学研究的实践层面，给这个判断加了一个非常扎实的注脚。瓶颈不在于模型有多大、算力有多强，而在于AI缺少某种我们目前还不太理解的累积推理机制。

说到这个，今天还有一个特别有意思的集体现象，就是技术社区里突然冒出来好几篇文章，不约而同地在说同一件事——我们是不是该慢下来了？

其中最打动我的是Flask框架的作者Armin Ronacher写的一篇。他用了一个特别好的比喻，他说你看一棵50年的橡树，你没法批量生产它，你只能等它慢慢长。信任、质量、社区，这些东西也是一样的，不可能从一个周末冲刺里凭空冒出来。他观察到最近一批YC的创业公司，连告别都没说就消失了。大量开源项目只有一周的提交记录就被遗弃。

然后他指出了一个特别讽刺的悖论。所有人都说AI帮我省了好多时间。但是你去看那些深度使用AI的人，他们的时间反而更少了。为什么？因为你省下来的时间，立刻就被竞争吞噬掉了。你快了，别人也快了。你用AI写代码快了三倍，那你的老板就期望你产出三倍的成果。最后你比以前还忙。

还有两位博主Dave Rupert和Jim Nielsen讨论了一个观点叫"人不是摩擦力"。他们说AI对每个学科的暗示是什么呢？就是别人的工作都很简单，只有你的工作才真正重要。AI在你耳边低语说，设计师的活儿嘛，AI几秒钟就搞定了，测试工程师嘛，AI也能干。但是你的工作，那才是不可替代的。Paul Ford说过一句特别狠的话，他说生活中最残酷的事实是，你热爱的学科，离开你鄙视的其他学科，就毫无意义。

还有一位叫Terence Eden的博主，他说了一句特别洒脱的话，他说被AI落下我完全没问题。他把当前的AI热潮跟早期加密货币那种FOMO策略做了类比。你还记得吗？当年所有人都跟你说，你现在不买比特币就晚了，你会错过一个时代。Eden说，如果AI真有那么好，我可以在我自己选择的时间点加入，不用被别人催着跑。

我觉得这些声音特别值得注意。因为说这些话的不是什么反技术的人，而是技术社区的核心人物。当Flask的作者、当这些在行业里摸爬滚打了十几二十年的老兵们，同时发出"慢下来"的信号的时候，这可能不只是几个人的牢骚，这可能代表了一种更广泛的情绪转向。

好，咱们说回技术新闻。今天有一条消息让不少媒体人炸了锅。The Verge报道说，Google搜索正在偷偷用AI改写网页标题。你没听错，不是改写摘要，是改写标题。

举个例子，The Verge有一篇文章，原标题是"I used the 'cheat on everything' AI tool and it didn't help me cheat on anything"，这是一个批评性的标题对吧，意思是这个号称能帮你作弊的AI工具其实啥也干不了。结果Google用AI把这个标题缩减成了五个词，变成了"Cheat on everything AI tool"。你品品，这几乎就像在给这个产品打广告了，完全反转了原文的意思。

Google说这只是一个小范围的实验，但他们拒绝透露实验的规模，而且这个做法已经扩展到新闻以外的网站了。知名科技博主John Gruber评论说，这已经不是跳过鲨鱼了，这是彻底迷失了方向。

你想想这意味着什么。搜索引擎是大多数人获取信息的入口。如果搜索引擎可以在不告诉你的情况下改写原作者说过的话，那信息源的可信度就从根本上被侵蚀了。你看到的标题，可能不是作者写的。你以为某个媒体在推荐一个产品，实际上人家是在批评它。这太恐怖了。

再来说一个开发者工具圈的大消息。Cursor发布了新版Composer 2，但真正让人意外的是它的底层模型。不是GPT，不是Claude，而是来自中国AI实验室的Kimi K2.5。Kimi.ai已经证实了这个合作，Cursor通过Fireworks AI平台获得授权，在Kimi K2.5的基础上做了持续预训练和强化学习。

这说明什么？AI编程工具的竞争已经不只是产品层面的竞争了，模型供应链本身也成了一个新的战场。前几天OpenAI收购了Python工具链公司Astral，争夺开发者工具链的控制权。现在Cursor选择了一个中国的开源模型作为基础，这意味着模型的来源、成本、定制化能力，都在成为竞争的关键变量。

最后给大家快速过几条值得关注的消息。Ed Zitron发布了一篇对Adobe的深度批评文，详细剖析了Adobe那些让人头疼的商业手段，包括隐藏的年度合同、高达百分之五十的提前终止费、产品内弹广告。美国司法部对Adobe的一亿五千万美元和解金，听着挺多，但只占Adobe两年收入的百分之零点三四五，简直就是毛毛雨。

Simon Willison用Claude反编译了1985年的Turbo Pascal，一个只有不到四万字节的可执行文件，里面居然塞下了一个完整的文本编辑器和Pascal编译器。这是一个特别精彩的AI实用能力小案例。

Firefox的新设计Nova UI引发了争议，新设计把标签页、地址栏和内容窗口完全分离开来，有人批评说这违反了最基本的设计原则——相关的元素应该看起来是相关的。

Google还在Android上对侧载应用加了新限制，未经Google验证的应用安装要等24小时。Gruber讽刺说Tim Sweeney收了一袋现金，同意Google在Android上怎么搞都算促进竞争，一直到2032年。

所以你看，今天的信息量很大，但如果要我提炼一个核心主题的话，我觉得就是两个字——边界。陶哲轩在探索AI能力的边界，那些技术博主在反思速度崇拜的边界，Google改写标题触碰了信息伦理的边界。我们正处在一个需要重新画线的阶段。AI很强大，但强大不等于万能。快速很诱人，但快速不等于正确。

如果您觉得我们的节目对您有帮助，请帮忙分享、转发给您的朋友，也欢迎直接回复邮件给我们提建议。好了，今天就到这里，我们明天见！