每日技术简报 — 2026年3月20日
执行摘要
今日最重磅内容是数学家陶哲轩(Terence Tao)与Dwarkesh Patel的深度对话,探讨AI在科学发现中的角色与局限,提出"人工巧思"与"人工智能"的关键区分。与此同时,多篇文章从不同角度反思AI热潮——从开发者实际体验到创业公司的短命周期,一股"慢下来思考"的思潮正在技术社区酝酿。此外,Google被曝用AI擅自改写搜索结果中的新闻标题,引发媒体强烈反弹。
主要报道
陶哲轩论AI与科学发现:广度惊人,深度不足
这是本日最值得深读的内容。陶哲轩在Dwarkesh Podcast中以开普勒发现行星运动定律的故事为切入点,系统阐述了AI对数学和科学研究的影响。
核心洞察:AI擅长广度,人类擅长深度。 陶哲轩指出,AI已将"想法生成"的成本降至接近零——正如互联网将通信成本降至接近零。但这并未自动创造丰裕,瓶颈转移到了验证、评估和判断哪些想法真正推动学科前进。
他分享了一个关键数据:在Erdős问题库中,AI辅助解决了约50个问题,但系统性研究显示,AI对任何给定问题的成功率仅约1%-2%。"如果你只关注社交媒体上广播的成功案例,看起来令人惊叹。但做系统性研究时,你会看到真实的成功率。"
陶哲轩提出了"人工巧思"(Artificial Cleverness)与"人工智能"(Artificial Intelligence)的区分。他描述与人类合作者解决问题时的过程——持续适应、累积改进、从部分进展中构建。而AI目前更像是"跳跃机器人",能跳得比人高,但无法在中途找到落脚点、停留、再从那里出发。"它们缺乏从部分进展中累积构建的能力。"
对个人生产力的诚实评估也很有价值。陶哲轩坦言,AI让他的论文变得更丰富(更多代码、图表、文献综述),但核心数学突破仍靠纸笔完成。"论文更丰富、更广泛,但不一定更深入。"
此前我们报道过AI规模扩张遭遇瓶颈(3月15-16日),Altman承认纯规模扩张无法通向AGI。陶哲轩的观察从实践层面印证了这一判断:当前AI的能力边界不在于规模,而在于缺少某种我们尚未理解的"累积推理"机制。
为何重要: 来自顶级数学家的一手体验报告,比任何基准测试都更能说明AI的真实能力边界。他对"人机混合将长期主导数学研究"的预判,值得所有AI应用领域的从业者参考。
"慢思考"反潮流:多位技术人反思AI速度崇拜
今日出现了罕见的集体反思现象,多篇独立文章从不同角度质疑"一切都要更快"的AI叙事。
Armin Ronacher(Flask框架作者)在"Some Things Just Take Time"中用种树做比喻:50年的橡树无法批量生产,信任、质量和社区也不会从一个周末冲刺中凭空出现。他观察到最近一批YC创业公司"连告别都没说就消失了",以及大量开源项目只有一周的提交记录就被遗弃。他特别指出一个悖论:所有人都说AI节省时间,但所有深度使用AI的人似乎时间反而更少了——"省下的时间立刻被竞争吞噬。"
Dave Rupert和Jim Nielsen讨论了"人不是摩擦力"这一主题。AI对每个学科的暗示是:别人的工作很简单,只有你的工作才真正重要。"AI在我们耳边低语:除了你,其他人的工作都很容易。" Paul Ford的话被引用:"生活中最残酷的事实是,你热爱的学科离开你鄙视的其他学科就毫无意义。"
Terence Eden则从个人角度表示:"被落下我完全没问题。"他将当前AI热潮与早期加密货币的FOMO(错失恐惧)策略类比——如果这项技术真如宣传的那样好,他可以在自己选择的时间节点加入。
为何重要: 这不是反技术的声音,而是来自技术社区核心人物的冷静思考。当Flask作者、知名博主们同时发出"慢下来"的信号时,值得注意这是否代表了一种更广泛的情绪转向。
来源:Armin Ronacher、Jim Nielsen、Terence Eden
Google用AI改写搜索标题,媒体震怒
The Verge报道,Google搜索正在实验性地用AI重写网页标题。一个案例中,The Verge的标题"I used the 'cheat on everything' AI tool and it didn't help me cheat on anything"被缩减为五个词:"'Cheat on everything' AI tool"——几乎像在为该产品背书。Google称这是"小范围、狭窄的实验",但拒绝透露实验规模,且该做法已扩展到新闻以外的网站。
John Gruber评论称这已远超"跳过鲨鱼"的程度,是"彻底迷失方向"。
为何重要: 这触及了信息生态的根基——当搜索引擎可以在不标注的情况下改写你说过的话时,信息源的可信度将从根本上被侵蚀。
来源:The Verge via Daring Fireball
Cursor的Composer 2基于中国AI模型Kimi K2.5构建
Kimi.ai证实,Cursor的新版Composer 2以Kimi-k2.5作为基础模型,通过Fireworks AI平台进行授权商业合作。Cursor在此基础上进行了持续预训练和高算力强化学习。这是开源模型生态的一个重要案例——中国AI实验室的模型通过商业合作进入主流开发者工具。
快讯
Adobe深度批评文:Ed Zitron发布长文详细剖析Adobe的商业模式——隐藏的年度合同、50%提前终止费、产品内广告。此前我们报道的SaaS危机(3月14日)在Adobe身上体现得淋漓尽致。DOJ的1.5亿美元和解金仅占Adobe两年收入的0.345%。(来源)
包管理器镜像全景调查:Andrew Nesbitt系统梳理了15+软件生态的镜像工具和协议,从Debian的成熟两阶段rsync到npm的CouchDB兼容API崩溃。此前我们报道的供应链安全话题(3月8日、17日)的基础设施层面。(来源)
Turbo Pascal 3.02A反编译:Simon Willison用Claude反编译了1985年39,731字节的Turbo Pascal可执行文件——包含完整文本编辑器IDE和Pascal编译器。一个AI实用能力的精彩小案例。(来源)
Firefox Nova UI争议:新设计将标签页、地址栏和内容窗口完全视觉分离,违反了"相关元素应看起来相关"的基本设计原则。(来源)
Google Android侧载新限制:未经Google验证的应用安装将需24小时等待期。Gruber讽刺道:Tim Sweeney拿了一袋现金,同意Google在Android上的任何做法到2032年前都是"促进竞争的"。(来源)
值得关注
- AI科学研究的"广度优先"范式:陶哲轩提出的"重新设计科学方式以利用AI的广度能力"值得持续关注。他预见一种全新的科学模式——先用AI大规模探测,再由人类专家深入攻坚。
- 开发者工具的模型层竞争:Cursor选择Kimi K2.5而非GPT或Claude作为基础模型,暗示AI编程工具的竞争正在向模型供应链层面延伸。此前OpenAI收购Astral(3月19日)争夺开发者工具链控制权,现在模型本身也成了争夺焦点。
- "技术减速"思潮:从Armin Ronacher到Terence Eden,从Ibrahim Diallo到Dave Rupert,越来越多有影响力的技术人开始公开质疑速度崇拜。这不是反AI,而是要求更诚实地面对AI的实际价值与局限。
大家好,欢迎来到2026年3月20日的 YOMOO 每日AI快送。
今天我跟你说一个特别有意思的事儿。全世界最顶尖的数学家之一,菲尔兹奖得主陶哲轩,他每天都在用AI做研究。你猜他怎么评价AI?他说,AI确实让他的论文变得更丰富了,更多代码、更多图表、更多文献综述。但是,真正的数学突破呢?还是靠纸和笔。你听听,这可不是什么AI怀疑论者说的话,这是一个深度使用AI的顶级科学家的一手体验。
陶哲轩在Dwarkesh Podcast上做了一期非常深入的对话,他提出了一个我觉得特别精妙的区分。他说,我们现在拥有的不是"人工智能",而是"人工巧思",英文叫Artificial Cleverness。什么意思呢?他打了个比方,说AI就像一个弹跳力超强的机器人,能一下子跳得比任何人都高。但问题是,它没法在半空中找到一个落脚点,停下来,喘口气,然后从那个位置再往上跳。换句话说,AI缺少一种从部分进展中不断累积、不断构建的能力。
你想想看,这其实就是人类科学家做研究的方式对吧?你先有一个不完美的想法,试一试,发现走不通,但是你从那个失败里学到了什么,调整方向,再往前走一步。就这样一步一步地,最终到达一个全新的发现。AI做不到这个。它要么一步跳到终点,要么就摔下来从头再来。
他还给了一个特别有说服力的数据。他说在一个叫Erdős问题库的数学难题集合里,AI辅助解决了大概50个问题,听起来很厉害对吧?但是你做系统性研究的时候就会发现,AI对任何一个给定问题的成功率只有百分之一到百分之二。百分之一到百分之二啊。你在社交媒体上看到的全是那些成功的案例,所以你觉得AI简直无所不能。但真实的成功率,远没有那么夸张。
这个观察其实和我们之前聊过的一个趋势完全吻合。上周Altman自己都承认了,纯粹靠规模扩张是到不了AGI的。陶哲轩从数学研究的实践层面,给这个判断加了一个非常扎实的注脚。瓶颈不在于模型有多大、算力有多强,而在于AI缺少某种我们目前还不太理解的累积推理机制。
说到这个,今天还有一个特别有意思的集体现象,就是技术社区里突然冒出来好几篇文章,不约而同地在说同一件事——我们是不是该慢下来了?
其中最打动我的是Flask框架的作者Armin Ronacher写的一篇。他用了一个特别好的比喻,他说你看一棵50年的橡树,你没法批量生产它,你只能等它慢慢长。信任、质量、社区,这些东西也是一样的,不可能从一个周末冲刺里凭空冒出来。他观察到最近一批YC的创业公司,连告别都没说就消失了。大量开源项目只有一周的提交记录就被遗弃。
然后他指出了一个特别讽刺的悖论。所有人都说AI帮我省了好多时间。但是你去看那些深度使用AI的人,他们的时间反而更少了。为什么?因为你省下来的时间,立刻就被竞争吞噬掉了。你快了,别人也快了。你用AI写代码快了三倍,那你的老板就期望你产出三倍的成果。最后你比以前还忙。
还有两位博主Dave Rupert和Jim Nielsen讨论了一个观点叫"人不是摩擦力"。他们说AI对每个学科的暗示是什么呢?就是别人的工作都很简单,只有你的工作才真正重要。AI在你耳边低语说,设计师的活儿嘛,AI几秒钟就搞定了,测试工程师嘛,AI也能干。但是你的工作,那才是不可替代的。Paul Ford说过一句特别狠的话,他说生活中最残酷的事实是,你热爱的学科,离开你鄙视的其他学科,就毫无意义。
还有一位叫Terence Eden的博主,他说了一句特别洒脱的话,他说被AI落下我完全没问题。他把当前的AI热潮跟早期加密货币那种FOMO策略做了类比。你还记得吗?当年所有人都跟你说,你现在不买比特币就晚了,你会错过一个时代。Eden说,如果AI真有那么好,我可以在我自己选择的时间点加入,不用被别人催着跑。
我觉得这些声音特别值得注意。因为说这些话的不是什么反技术的人,而是技术社区的核心人物。当Flask的作者、当这些在行业里摸爬滚打了十几二十年的老兵们,同时发出"慢下来"的信号的时候,这可能不只是几个人的牢骚,这可能代表了一种更广泛的情绪转向。
好,咱们说回技术新闻。今天有一条消息让不少媒体人炸了锅。The Verge报道说,Google搜索正在偷偷用AI改写网页标题。你没听错,不是改写摘要,是改写标题。
举个例子,The Verge有一篇文章,原标题是"I used the 'cheat on everything' AI tool and it didn't help me cheat on anything",这是一个批评性的标题对吧,意思是这个号称能帮你作弊的AI工具其实啥也干不了。结果Google用AI把这个标题缩减成了五个词,变成了"Cheat on everything AI tool"。你品品,这几乎就像在给这个产品打广告了,完全反转了原文的意思。
Google说这只是一个小范围的实验,但他们拒绝透露实验的规模,而且这个做法已经扩展到新闻以外的网站了。知名科技博主John Gruber评论说,这已经不是跳过鲨鱼了,这是彻底迷失了方向。
你想想这意味着什么。搜索引擎是大多数人获取信息的入口。如果搜索引擎可以在不告诉你的情况下改写原作者说过的话,那信息源的可信度就从根本上被侵蚀了。你看到的标题,可能不是作者写的。你以为某个媒体在推荐一个产品,实际上人家是在批评它。这太恐怖了。
再来说一个开发者工具圈的大消息。Cursor发布了新版Composer 2,但真正让人意外的是它的底层模型。不是GPT,不是Claude,而是来自中国AI实验室的Kimi K2.5。Kimi.ai已经证实了这个合作,Cursor通过Fireworks AI平台获得授权,在Kimi K2.5的基础上做了持续预训练和强化学习。
这说明什么?AI编程工具的竞争已经不只是产品层面的竞争了,模型供应链本身也成了一个新的战场。前几天OpenAI收购了Python工具链公司Astral,争夺开发者工具链的控制权。现在Cursor选择了一个中国的开源模型作为基础,这意味着模型的来源、成本、定制化能力,都在成为竞争的关键变量。
最后给大家快速过几条值得关注的消息。Ed Zitron发布了一篇对Adobe的深度批评文,详细剖析了Adobe那些让人头疼的商业手段,包括隐藏的年度合同、高达百分之五十的提前终止费、产品内弹广告。美国司法部对Adobe的一亿五千万美元和解金,听着挺多,但只占Adobe两年收入的百分之零点三四五,简直就是毛毛雨。
Simon Willison用Claude反编译了1985年的Turbo Pascal,一个只有不到四万字节的可执行文件,里面居然塞下了一个完整的文本编辑器和Pascal编译器。这是一个特别精彩的AI实用能力小案例。
Firefox的新设计Nova UI引发了争议,新设计把标签页、地址栏和内容窗口完全分离开来,有人批评说这违反了最基本的设计原则——相关的元素应该看起来是相关的。
Google还在Android上对侧载应用加了新限制,未经Google验证的应用安装要等24小时。Gruber讽刺说Tim Sweeney收了一袋现金,同意Google在Android上怎么搞都算促进竞争,一直到2032年。
所以你看,今天的信息量很大,但如果要我提炼一个核心主题的话,我觉得就是两个字——边界。陶哲轩在探索AI能力的边界,那些技术博主在反思速度崇拜的边界,Google改写标题触碰了信息伦理的边界。我们正处在一个需要重新画线的阶段。AI很强大,但强大不等于万能。快速很诱人,但快速不等于正确。
如果您觉得我们的节目对您有帮助,请帮忙分享、转发给您的朋友,也欢迎直接回复邮件给我们提建议。好了,今天就到这里,我们明天见!