OpenAI研究员宣布其实验性AI模型在国际数学奥林匹克竞赛中达到金牌级表现,匹配每年仅不到9%人类参赛者能达到的标准。该模型在4.5小时限时内解决六道证明题,无网络和计算器辅助。然而OpenAI违反了IMO组织方要求等到7月28日再发布结果的协议,且因自评分引发争议。与谷歌需要三天解题不同,OpenAI声称其模型如标准语言模型般处理问题并生成自然语言证明。