数据层面的变化相对清晰,执行层面的反馈则更复杂。
最近,一则来自erdosproblems.com的消息迅速在Scientific American和Hacker News上发酵。23岁的Liam Price没有接受过高级数学训练,却在一个普通周一下午,向GPT-5.4 Pro输入一个提示,模型在约80分钟的连续思考后,输出了一份针对Erdős问题1196的证明草稿。
它要求人类仔细“sift through”——像淘金般筛选意图,修复逻辑缺口。主流报道聚焦励志逆袭,却较少触及AI生成内容的粗糙本质。
主流报道多强调“AI随便就解决了人类卡60年的难题”,Hacker News讨论帖迅速积累数百回复,网友惊叹业余玩家加大模型的组合。Terence Tao等专家在erdosproblems.com论坛给出初步反应,有人称赞证明的优雅,有人则指出这远非单纯计算辅助。表面热闹之下,很多人忽略了关键:AI生成的证明避开了人类从1935年以来集体采用的“分析转概率”标准路径,这一隐形定势才是长时间未解的深层原因。
判断Erdős问题是否适合AI尝试时,清晰陈述是首要门槛。一句话或几行公式就能概括的问题,像#1196的核心界限估计,远比需要大量预备知识的几何问题友好。大型语言模型擅长解析这类逻辑结构,能快速生成假设路径或证明草稿。初学者也因此更容易找到切入点。实际操作中,直接复制问题原文,辅以“从基本数论出发找模式”的指令,往往就能启动有效探索。结合OEIS序列搜索小规模数据,进一步降低幻觉风险。
历史上,人类因集体定势错过简单路径的案例并不鲜见,这次AI的“vibe mathing”模式恰好提供了新鲜的粗糙洞见,而非完美的现成答案。
人类研究路径往往从分析工具切入,再自然转向概率框架,这种“分析转概率”的标准走法自1935年起就成为默认套路。结果是集体在早期步骤形成隐形定势,即使Lichtman与Fields Medal级合作者联手,也难以突破。数据支持这一观察:Lichtman证明了Erdős和的上界接近1.636,却在1196的渐近版本上反复受阻。方向是对的,但现实更复杂——微小的早期偏差积累成巨大障碍。
深层来看,这起事件戳中了人类思维的集体盲区。Tao指出,许多研究者习惯从标准路径出发,导致后续努力事倍功半。AI因缺乏这些先入为主的框架,反而能发现意想不到的连接,比如将von Mangoldt函数与原始集问题结合。对SEO内容创作者而言,这是一个清晰信号:传统niche数学或科技话题写作常卡在“切入角度雷同”上,大家内容高度相似,搜索意图虽强却难脱颖而出。
问题本身源于Erdős、Sárközy和Szemerédi约60年前的猜想,核心围绕原始集(primitive sets)——即任意两个不同元素不存在整除关系的正整数集合——在足够大数上的渐近行为。
这个案例让行业观察者看到,强大语言模型在狭窄前沿领域已能生成原创洞见,尽管仍需人类严格检查与打磨。Liam Price的“vibe mathing”实验,本质上是让AI在无预设约束下探索可能性,结果它走出一条人类集体盲区之外的路径。数据支持AI辅助数学研究的潜力在提升,但样本仍有限,值得持续跟踪的是,这种新方法能否在其他类似问题中复制。
这个过程被Price和社区称为“vibe math”——凭直觉式提示反复试错,让模型自由探索不同数学分支的已知工具,再由人类筛查精炼。Price本人甚至没有深入背景知识,只是闲散地将问题丢给GPT-5.4 Pro,结果模型吐出一个看似靠谱的框架,后续经Lichtman等人打磨成更简洁的形式。相比AlphaGo的Move 37,这一步同样开辟了新路径:不是优化现有招式,而是打破人类因习惯而形成的认知壁垒。
我的判断是——但这个判断可能需要修正——真正持久的玩家,会选择更克制的路径。