游戏性能评估 关键字列表
为什么大语言模型在视频游戏上表现如此糟糕?

为什么大语言模型在视频游戏上表现如此糟糕?

尽管大语言模型在编程等领域快速进步,但在电子游戏方面却表现极差。纽约大学游戏创新实验室主任朱利安·托格留斯的研究显示,LLM无法掌握通用游戏技能。编程被视为"行为良好的游戏",有明确的任务、即时反馈和测试机制,而电子游戏缺乏这些特征。LLM在空间推理方面表现不佳,且不同游戏间差异巨大。虽然LLM能编写简单游戏代码,但无法测试和迭代改进游戏体验。