但过度使用又容易让用户产生疲劳,需要把握分寸。
那个普通的周一下午,Price对GPT-5.4 Pro发出了一个简洁描述Erdős Problem #1196核心的提示,没有复杂的文献铺垫,也没有预设分析框架。模型思考了约80分钟,输出了一份粗糙却蕴含关键洞见的证明草稿。Price将结果贴到论坛后,很快引发讨论。他的合作者意识到潜在价值,联系专家进行验证。专家们确认证明成立,且方法与人类以往路径截然不同。
对比Erdős问题本身的众包历史——erdosproblems.com正是这种协作精神的延续——AI的介入让更多非专业人士有机会提供初始洞见。过去陶哲轩等专家已通过对话式提示辅助类似工作,这次事件的核心同样在于人机协同:提示词成为新入口,而验证仍需专业素养。
深层看,这次事件并非AI施展魔法,而是通过直觉式提示——业内称为“vibe mathing”——打破了人类长期形成的领域壁垒。Erdős问题1196本质是探究原始集在数轴远端的渐近行为,传统方法易陷入固定分析框架,而GPT-5.4 Pro保留算术视角,利用von Mangoldt函数结合概率链视角,避开了常见障碍。问题驱动学习在这里显现优势:从具体开放问题出发,反复迭代提示,让模型尝试跨领域连接,远胜按部就班刷教材习题的线性路径。
长期而言,如果更多类似突破涌现,它或将催生新的数学思考范式,帮助我们重新审视大数结构中的隐含联系。AI在这里更像“新连接方法”的提供者,而非独立证明者。其原始输出往往需要人类精炼,这也提醒我们:AI辅助数学仍有明显边界。如果人类过度依赖直觉式跳跃,是否会逐渐削弱自身严谨推理能力?这一点目前行业内仍有不同声音,现在下结论为时尚早。
问题1196正是这一猜想的精确表述,焦点在于衰减速度的定量控制。多年来,顶尖专家如Jared Lichtman虽在原始集猜想的原始版本上取得突破,却在这一渐近形式上卡住七年。
表面信息往往聚焦于戏剧性的一面。Scientific American和Forbes等媒体报道了这个“业余爱好者武装ChatGPT破解难题”的故事,Hacker News和Reddit的r/math版块上充斥着惊叹声,有人直接称其为数学民主化的标志性时刻。Terence Tao在评论中指出,AI的路径避开了人类研究者长期陷入的初始固定模式,转而用von Mangoldt函数以一种非标准方式处理分析困难。
对普通人自学数学而言,门槛正在降低。短期内,更多业余爱好者和学生可能涌向Erdős问题网站,用ChatGPT或类似模型尝试攻克开放条目,形成一波辅助解决潮。长期来看,ChatGPT数学学习让前沿探索不再专属专业训练者,但需警惕AI依赖导致的浅层理解。如果AI证明能持续通过Lean等形式化验证,教育模式或转向提示工程加人类批判思考;否则影响可能局限于少数实践者。这一点目前行业内仍有不同声音。
AI这次采用的路线截然不同。它没有急于转向概率框架,而是停留在算术领域,直接调用von Mangoldt函数——这一数论经典工具常用于素数分布和Riemann zeta函数研究。该函数的核心恒等式编码了整数唯一分解定律,AI以人类未曾尝试的方式将其与原始集倒数对数和收敛问题拼接,最终证明对于任意原始集A,当考虑大于x的元素时,∑ 1/(a log a) ≤ 1 + O(1/log x)。这个剪刀差式的对比,凸显了方法创新的价值。
岁的Liam Price没有接受过高级数学训练,却在一个普通周一下午,通过向GPT-5.4 Pro输入一个简单提示,获得了Erdős问题1196的正确证明。该问题涉及primitive sets的自然密度猜想,由Erdős、Sárközy和Szemerédi在1960年代提出,已困扰数学家超过60年。Scientific American报道称,Price的输出经专家如Jared Duker Lichtman等人精炼后被确认有效。
表面上,这件事被媒体和网友迅速包装成“业余+AI轻松破难题”的故事。不少报道强调“23岁小伙一键破解60年老问题”,Hacker News和Reddit上热议AI是否即将取代专业数学家,或者它只是一个高效工具。部分观点兴奋于数学研究门槛降低,另一些则担忧传统严谨证明路径会被随意“vibe mathing”取代。这些讨论抓住了事件的戏剧性,却往往停留在结果层面。
这个现象的延续性,取决于后续资本和政策的配合度。