现代AI编程工具已彻底改变软件工程,开发者大量使用AI助手编写代码。作为机器学习理论研究者,我们发现类似变革正在科学研究方法论中发生,特别是数学性质的研究。AI工具现在能够仅从高层证明草图提示中开发和编写严格的数学证明。这些证明用正式的数学论证"语言"编写,就像代码用Python等编程语言编写一样。AI似乎已经精通这两种语言及其底层逻辑。
谷歌DeepMind团队开发的AI系统AlphaProof在2024年国际数学奥林匹克竞赛中获得银牌水平表现。该系统结合神经网络、搜索算法和测试时强化学习,能够理解数学结构并进行形式化证明。团队使用Lean编程语言训练AI翻译和验证数学陈述,创建了8000万个形式化数学问题的数据库。虽然计算成本高昂且需要几天时间解决问题,但这标志着AI在高级数学推理方面的重大突破。