计算机科学家梅兰妮·米切尔在NeurIPS大会上发表主题演讲,探讨如何更好地评估AI认知能力。她认为当前AI评估方法存在缺陷,仅依靠基准测试准确率无法反映真实世界表现。她建议借鉴发展心理学和比较心理学的实验方法,通过对照实验、刺激变化测试等方式深入探究AI系统的认知机制,并强调科学研究中保持怀疑态度的重要性。