不确定性量化 关键字列表
识别过度自信大语言模型的更优方法

识别过度自信大语言模型的更优方法

麻省理工研究人员开发了一种新的不确定性量化方法,通过对比目标模型与类似模型群组的响应来测量跨模型分歧,更准确识别大语言模型自信但错误的输出。该方法结合了模型自一致性测量,创建总不确定性指标,在问答和数学推理等十项任务中表现优异,能有效识别不可靠预测,为医疗和金融等高风险场景提供更可靠的模型评估。