收听音频版
下载 MP3

每日科技简报 | 2026年3月18日

执行摘要

今天的信息流呈现出一个深刻的主题:技术工具中隐藏的决策权力。从AI代码生成工具暗含的设计准则,到通信系统天然的监控属性,再到Cory Doctorow对技术政治的重新审视,这些文章共同指向一个核心问题——当我们使用工具时,究竟是谁在做决定?与此同时,一场用咖啡杯检验大语言模型物理直觉的实验,为AI能力边界提供了别开生面的注脚。


主要报道

AI工具的"特洛伊木马":你同意的规则,你从未见过

这是今天最值得深思的话题,且与我们此前持续关注的编程代理议题直接相关。

博主Jim Nielsen发现了一件耐人寻味的事:OpenAI的Codex(编程代理工具)内部嵌入了一套前端设计准则,包括"使用有表现力的字体,避免默认字体栈""用有意义的动画替代通用微交互""避免千篇一律的布局模板"等。这些准则本身并无问题,但问题在于——如果这些规则由一个设计主管在团队会议上提出,一定会引发激烈辩论

"这就像一匹工艺的特洛伊木马:你可能永远不会明确同意的准则,正在悄悄指导LLM的输出——这意味着你在隐性地同意它们。"

Nielsen一语道破要害:当你将思考外包给工具时,你可能在内化一套你从未审视过的价值判断。此前我们报道过编程代理展现出惊人的逆向工程能力,子代理架构已成行业标准模式——这些工具越强大,其内嵌决策的影响就越深远。一个AI代理不仅在帮你写代码,它还在替你做设计决策、架构取舍,甚至审美判断,而这一切都发生在你看不见的地方。

这与Cory Doctorow同日发表的长文形成了精彩的思想对位。Doctorow重新诠释了William Gibson的名言"街头会为事物找到自己的用途",将其与撒切尔的"别无选择"论和左翼纯洁主义进行对照。他的核心论点是:技术的政治属性不是不可改变的,起源之罪不应永远定义一项技术的命运

"当激进的技术人员谋划解放技术时,他们不是在试图救赎某个设备——他们是在解放人。"

将两篇文章并读,一个清晰的图景浮现:工具内嵌的价值观确实存在(Nielsen的发现),但这些价值观并非命中注定、不可更改(Doctorow的论证)。关键在于可见性——你无法辩论你看不见的东西。


用一杯咖啡检验LLM的物理直觉

Dynomight做了一个迷人的实验:让多个LLM预测沸水倒入陶瓷杯后的温度变化曲线,然后用实际测量来验证。

结果颇有启发:所有模型都给出了基于指数衰减的方程,且都捕捉到了一个正确的直觉——早期降温速度远快于后期。但实际数据显示,现实中早期降温比模型预测的更快,后期更慢。Claude 4.6 Opus表现最佳,但花费了0.61美元的token——作者调侃这大概是史上最贵的中学科学实验。

有趣的是,这类问题没有"正确答案"可以通过推导获得,因为涉及传导、对流、蒸发、辐射等多重物理过程,且许多细节(杯子材质、桌面材料、空气湿度)未在提示中指定。这实际上测试的是LLM的**"品味"——在不完整信息下做合理假设的能力**。


通信即监控:一个无法逃脱的架构事实

Ibrahim Diallo从《谍影重重》的经典挂电话桥段出发,揭示了一个残酷的现实:电影里那个"需要更多时间来三角定位"的情节纯属虚构。手机连接基站的瞬间,位置数据就已被记录。CDR(通话详细记录)自动生成,包含通话对象、时长和处理基站。真正保护Jason Bourne的不是技术,而是执法机构获取数据所需的官僚流程和法律审批。

文章逐层递进:从手机到互联网(ISP知道你访问了哪些域名),从HTTPS(加密内容但不加密连接元数据)到E2EE(端到端加密,如Signal),最终得出结论:我们无法让通信变得不可见,只能让它变得不可读


快讯

  • Git远程助手生态全景:Andrew Nesbitt梳理了git-remote-helper协议的完整生态,从云存储(S3、Dropbox)到加密(GPG)、P2P(IPFS、Nostr)、区块链等,并介绍了正在开发的git-remote-swh,可通过内容哈希从Software Heritage档案库克隆代码,为可复现构建和供应链验证提供新原语。

  • Wayland合并窗口管理器的合理性:Chris Siebenmann解释了为什么Wayland将窗口管理器内嵌到显示服务器中是深思熟虑的选择——X11将两者分离导致了事件处理的竞态条件和诸多限制(如滚轮事件无法重定向)。

  • 工程经理为何仍应写代码:不碰关键路径,只做小bug修复和工具改进——既保持技术判断力,又通过代码实践为团队树立标准,这是Andy Grove所说的"通过训练提升团队产出"的最佳体现。

  • 远程解锁加密硬盘:jyn通过在initramfs(初始内存文件系统,Linux启动时运行的迷你操作系统)中部署Tailscale VPN和Dropbear SSH服务器,实现了远程输入磁盘解密密码,解决了断电重启后无法远程访问的问题。

  • Django表单文档的教训:过去的自己觉得显而易见的表单权限规则,现在的自己完全想不起来——这是一个关于"记录你认为不需要记录的东西"的经典案例。


值得关注

  • 工具透明度之争正在升温:随着AI编程代理的能力和采用率飙升,其内嵌决策的不透明性将成为越来越大的争议焦点。预计会出现要求AI工具公开其系统指令的呼声。

  • Apple的AI"以小博大"策略:Horace Dediu指出,当超大规模云厂商将94%的运营现金流投入AI基础设施、Amazon甚至预计自由现金流转负280亿美元时,Apple仅以140亿美元资本支出和每年10亿美元的Gemini费用静观其变。这要么是天才之举,要么是致命误判——取决于Apple Intelligence能否真正达到一流水平。

PODCAST SCRIPT

大家好,欢迎来到2026年3月18日的 YOMOO 每日AI快送。

我跟你说,今天我看到一个特别有意思的发现,看完之后后背有点发凉。你每天用AI写代码对吧?你觉得是你在做决定。但实际上呢,有人扒出来了,OpenAI的编程工具Codex里面,藏着一整套设计规范。什么"要用有表现力的字体"啊,"不要用默认布局模板"啊,"动画要有意义"啊。你说这些规则本身有问题吗?没问题。但问题在哪儿呢?问题在于,如果这些规则是你的设计主管在会议上提出来的,你肯定会跟他吵一架。你会说,凭什么?我不同意。但现在呢,这些规则悄悄藏在AI工具里面,你连它们的存在都不知道,你就已经在按照它们干活了。

博主Jim Nielsen把这个叫做"工艺的特洛伊木马"。你想想看,这个比喻太精准了。特洛伊木马是什么?外面看着是个礼物,里面藏着士兵。你以为AI只是在帮你写代码,其实它还在替你做设计决策、架构取舍,甚至审美判断。而这一切,都发生在你看不见的地方。

这还没完。同一天,科技评论界的大佬Cory Doctorow发了一篇长文,跟这个话题形成了一个特别精彩的对话。Doctorow说了一句话,我觉得特别深刻,他说"当激进的技术人员谋划解放技术时,他们不是在试图救赎某个设备,他们是在解放人。"什么意思呢?就是说,工具里藏着价值观,这是事实,Nielsen已经证明了。但这些价值观不是天注定的,不是不能改的。关键在哪儿?关键在于可见性。你没办法对你看不见的东西提出质疑。你连辩论的机会都没有。

所以你看,随着AI编程工具越来越强大,这个透明度的问题,一定会成为下一个大争议焦点。我估计很快就会有人站出来要求,AI工具必须公开它们的系统指令。这事儿值得你持续关注。

好,咱们换个轻松点的话题。今天有个实验特别好玩,有人用一杯咖啡去检验大语言模型到底懂不懂物理。

Dynomight这个博主做了什么呢?他把沸水倒进一个陶瓷杯里,然后问好几个AI模型,你帮我预测一下,这杯水的温度会怎么变化。然后他拿温度计实际去量,看谁猜得准。

结果挺有意思的。所有模型都知道用指数衰减的方程来描述降温过程,这说明它们确实有一定的物理直觉。而且它们都抓住了一个对的趋势,就是刚开始降温快,后面降温慢。但实际测量发现呢,现实中早期降温比模型预测的还要快,后期比预测的还要慢。表现最好的是Claude 4.6 Opus,但是花了0.61美元的token费用。作者开玩笑说,这大概是人类历史上最贵的中学物理实验了。

但你仔细想想,这个实验真正测试的是什么?不是AI会不会解物理方程。这类问题根本就没有标准答案,因为涉及传导、对流、蒸发、辐射,还有杯子是什么材料的、桌面是什么材料的、空气湿度多少,这些信息都没给。所以它测试的其实是AI的"品味",就是在信息不完整的情况下,做合理假设的能力。这个角度,我觉得特别妙。

接下来说一个让人有点不安的话题。你看过谍战电影吧?主角打完电话赶紧挂掉,因为怕被追踪定位。电影里总说"再给我30秒,马上就能锁定他的位置"。Ibrahim Diallo告诉你,这完全是编的。

真实情况是什么呢?你的手机连上基站的那一瞬间,你的位置数据就已经被记录了。不需要30秒,不需要三角定位,一瞬间的事。通话详细记录会自动生成,里面包含你打给谁、打了多久、经过哪个基站。那你说,Jason Bourne到底是怎么活下来的?答案不是技术保护了他,而是官僚流程保护了他。执法机构要拿到这些数据,得走法律审批,这个过程需要时间。

这篇文章最精彩的地方在于它的结论。从手机到互联网,从HTTPS到端到端加密,作者一层一层剥给你看,最后得出一句话:我们没办法让通信变得不可见,只能让它变得不可读。你品品这句话,通信这个行为本身就意味着你暴露了元数据,你唯一能做的,是把内容加密到别人读不懂。

最后快速过几条值得关注的消息。Andrew Nesbitt梳理了Git远程助手的整个生态,从云存储到加密到P2P到区块链,还有一个正在开发中的工具可以通过内容哈希从Software Heritage档案库克隆代码,这对软件供应链安全来说是个很有意思的新方向。另外,有人写了一篇关于工程经理为什么还应该写代码的文章,观点很务实,不碰关键路径,只做小bug和工具改进,既保持技术判断力,又能以身作则。还有一条,Django社区有人分享了一个教训,过去的自己觉得显而易见不需要记录的东西,现在的自己完全想不起来了,这是一个关于"记录你认为不需要记录的东西"的经典提醒。

对了,最后还有一个大的值得关注的事。Apple的AI策略。你知道吗,那些超大规模云厂商正在把94%的运营现金流砸进AI基础设施,Amazon甚至预计自由现金流会变成负280亿美元。但Apple呢?只花了140亿美元资本支出,加上每年给Google付10亿美元用Gemini,就在旁边看着。这要么是天才级别的以小博大,要么就是致命的误判。答案取决于Apple Intelligence到底能不能达到一流水平。这个悬念,可能要到年底才能揭晓。

好了,今天的内容就是这些。总结一下今天最核心的一个思考:当你在使用工具的时候,到底是你在做决定,还是工具在替你做决定?这个问题,值得每一个技术人认真想想。

如果您觉得我们的节目对您有帮助,请帮忙分享、转发给您的朋友,也欢迎直接回复邮件给我们提建议。好了,今天就到这里,我们明天见!