陶哲轩亲自曝光:AI破解数学难题,竟全是「抄」的?
新智元导读】数学大神陶哲轩近期发现,AI声称破解的Erdos难题,实则是多年前已被人类解决但被遗忘的「旧闻」。这揭示了AI当前的核心能力并非从0创新,而是利用超强算力扫描人类文献的「长尾黑洞」,摘取那些被我们忽视的「低垂果实」。最近几周,数学界就发生了几起这样让人「哭笑不得」但又极具深意的事件。几个大名鼎鼎的Erdos 问题(数学怪才保罗·厄尔多斯提出的悬赏问题,解决它们是数学家的荣耀),被最新的人工智能工具「自主」解决了。全网本来准备欢呼AI又一次超越人类,结果反转来了。不对啊!这些问题,早在几年前、甚至十几年前的冷门文献里,就已经被人解决过了!这事儿就有意思了。AI 以为自己搞了原创新发,结果是在搞「考古」。https://nimg.ws.126.net/?url=http%3A%2F%2Fdingyue.ws.126.net%2F2025%2F1228%2F08fcd621j00t7yt6m00exd200u000sug00x400vt.jpg&thumbnail=660x2147483647&quality=80&type=jpg但这事绝不仅仅是一个「AI闹乌龙」的笑话。陶哲轩在Mastodon上对此事发表了看法。他透过这个看似「翻车」的现象,精准地指出了当下AI进化的真正逻辑。今天,我们就来扒一扒陶哲轩眼中的AI真相:它到底是在思考,还是在作弊?陶哲轩的质疑:是「偷看答案」还是「捡软柿子」?事情发生后,大部分人的第一反应是:数据污染。这很好理解。现在的AI模型(比如GPT-4、Claude等)都是吃着海量互联网数据长大的。大家觉得,这AI肯定是「作弊」了。它可能在训练数据里偷偷看过那些冷门论文的答案,把它编码在权重里。等到你问它的时候,它不是「推导」出来的,而是像背课文一样「背」出来的。但在陶哲轩看来,事情没那么简单。他敏锐地指出一个疑点:其他的深度研究类AI工具,并没有发现这些联系。https://nimg.ws.126.net/?url=http%3A%2F%2Fdingyue.ws.126.net%2F2025%2F1228%2F3809b752j00t7yt6m007gd200u000cng00wc00dm.jpg&thumbnail=660x2147483647&quality=80&type=jpg
如果仅仅是数据污染,仅仅是死记硬背,那应该是所有看过这份数据的模型都能答上来。但事实是,有的行,有的不行。于是,陶哲轩抛出了一个极具洞察力的理论:「低垂果实」)。他在文中写道:我的理论是,人工智能工具现在变得足够强大,可以解决 Erdos 问题数据库中列为开放问题的「最易摘取的果实」。https://nimg.ws.126.net/?url=http%3A%2F%2Fdingyue.ws.126.net%2F2025%2F1228%2F7e8fa854j00t7yt6n00dxd200u000m3g00wm00o0.jpg&thumbnail=660x2147483647&quality=80&type=jpg
什么叫「最易摘取的果实」?陶哲轩解释得很清楚:「那些使用相当标准的技术、通过简单证明就能解决的问题」。重点来了!这里有一个巨大的认知反差:这类「简单问题」,恰恰也是人类数学文献中的「盲区」。因为证明过程相对简单,当年的数学家可能觉得「这也没啥了不起的」,就没有大张旗鼓地宣传,或者随手发在了一个不知名的期刊角落里。这就导致了一个极其尴尬的现状:这些问题在著名的「Erdos问题数据库」里,依然显示为「Open(未解决)」状态。但实际上,它们在几十年前就已经被某位无名学者解决了。这就是陶哲轩看穿的真相:AI 并没有像数学家那样发明了全新的数学大厦,它做的事情更像是「捡漏」。它利用强大的算力与模式识别能力,把那些「名义上未解决,实际上已被解决,但被人类遗忘在角落」的问题,重新挖掘了出来。这就完美解释了为什么AI能解决这些问题,且这些问题恰好都已经在文献里有了答案。不是因为AI偷看了答案,而是因为这些题目本身就是「易碎品」,AI现在的智商刚好够得着它们。AI的「超强扫雷」能力陶哲轩的这个发现,实际上给全人类的知识管理体系一记耳光。我们以为科学大厦是层层累进的,实际上,科学文献里充满了「长尾」。成千上万的论文躺在数据库里吃灰,无数的微小进展因为没有大佬站台而被淹没。这就是陶哲轩所说的「未被充分研究的问题」。https://nimg.ws.126.net/?url=http%3A%2F%2Fdingyue.ws.126.net%2F2025%2F1228%2Ffcd45f83j00t7yt6q0082d200u000dvg00wq00f4.jpg&thumbnail=660x2147483647&quality=80&type=jpg
在相关讨论中,有一位网友提出了一个玄幻且精准假设,甚至被陶哲轩的读者们热议:「信息黑洞」。这些解决方案的信息,其实早已被编码在旧的神经网络权重里,或者存在于浩瀚的互联网数据中。https://nimg.ws.126.net/?url=http%3A%2F%2Fdingyue.ws.126.net%2F2025%2F1228%2F4f7008f2j00t7yt6r009cd200u000l4g00x000n8.jpg&thumbnail=660x2147483647&quality=80&type=jpg
但是,它们不是以「教科书」那样结构化的方式存在的,而是「非局域化」的。就像黑洞吞噬了信息,信息还在那,但已经乱码了。对于人类来说,想要从这堆乱码里找到「这个问题在1998年被解决过」的线索,计算成本太高了,根本做不到。你不可能为了解决一个问题,去读完过去50年的所有论文。但AI能做到。陶哲轩在文中极其乐观地预测:「这种工具能力的进步是不可小觑的,这为自动扫描数学文献中那些未被充分研究的长尾问题带来了良好的前景。」这正是AI目前的核心价值:它不是一个无中生有的「创作者」,它是一个拥有超强算力的「超级图书管理员」。短期内,我们将看到大量此类事件发生:AI宣称解决了问题,然后人类发现这只是把旧知识重新打包。但千万别嘲笑它!这恰恰证明了AI填补了人类知识体系中最大的漏洞——遗忘。AI正在把那些散落在历史尘埃里的珍珠,一颗颗捡回来。陶哲轩引发的思考看到这里,你可能会问:这跟我们普通人有什么关系?我又不做数学题。在陶哲轩这篇内容的评论区里,有一个网友留言:https://nimg.ws.126.net/?url=http%3A%2F%2Fdingyue.ws.126.net%2F2025%2F1228%2Fac9df38dj00t7yt6s00aed200u000l9g00wy00nc.jpg&thumbnail=660x2147483647&quality=80&type=jpg
以前,想要发现「黎曼猜想」和「物理学」之间的联系,你需要是顶级高校数学博士,需要读遍过去50年的顶级期刊,外加极好的运气。但现在,因为AI能够处理那些「被扰乱的信息」,能够扫描那些「长尾知识」。就有发现「金矿」的机会。还有网友评论道:「AI到底是在推理,还是在产生幻觉?」https://nimg.ws.126.net/?url=http%3A%2F%2Fdingyue.ws.126.net%2F2025%2F1228%2F03612e93j00t7yt6s003xd200u000ajg00wg00bd.jpg&thumbnail=660x2147483647&quality=80&type=jpg
有人回答得一针见血:「它在逼近理性,但方式非常低效且容易产生幻觉,因为它没有基于逻辑推理形式。」https://nimg.ws.126.net/?url=http%3A%2F%2Fdingyue.ws.126.net%2F2025%2F1228%2F1c80b6c2j00t7yt6t0048d200u000a5g00wu00b3.jpg&thumbnail=660x2147483647&quality=80&type=jpg
陶哲轩通过这次事件其实在暗示我们:AI负责在「垃圾堆」里找线索,人类负责验证这些线索是否正确。陶哲轩的这次「打假」行动,表面看是AI的尴尬,实则是AI的军功章。他让我们看清了AI现阶段最强大的能力,不是「写诗作画」,而是「知识考古」。正如陶哲轩所预测的:这种趋势在短期内会持续。AI将继续在没有专家监督的情况下,横扫那些名义上的「开放问题」。这是一个「捡漏」的时代。以前,捡漏靠运气,靠家学渊源;现在,捡漏靠AI,靠谁能更早地理解「长尾扫描」的价值。
看看 优秀帖子,感谢分享。[喜欢] 111 感谢分享。 谢谢楼主分享!
页:
[1]