科罗拉多大学研究人员发现,大型语言模型在解决数独谜题时表现不佳,即使是简化的6x6数独也常常超出其能力范围。更重要的是,当要求AI展示解题过程时,它们往往无法准确解释,有时会撒谎、胡言乱语,甚至开始谈论天气。研究表明,AI虽然擅长写邮件或生成图像,但在需要逻辑推理的任务上存在明显缺陷,且无法透明地解释其决策过程,这对AI在日常生活中的应用提出了谨慎考量的要求。