研究发现,允许大语言模型生成推理过程(即思维链),即便面对简单的单跳事实性问题,也能显著提升正确答案的召回率。研究揭示了两种驱动机制:一是利用生成的推理标记执行潜在计算(计算缓冲效应);二是通过生成相关事实来激活正确答案的回忆(事实启动效应)。实验基于Gemini-2.5和Qwen3-32B模型,在SimpleQA与EntityQuestions数据集上验证了上述结论。