MIT、伍斯特理工学院和谷歌的研究人员提出了一种名为"加权旋转去偏见"(WRING)的新方法,用于解决AI视觉语言模型中的偏见问题。现有的"投影去偏见"方法会导致"打地鼠困境"——消除一种偏见的同时可能放大其他偏见。WRING通过旋转高维空间中与偏见相关的坐标,在不影响模型其他关系的前提下消除特定偏见,且无需重新训练模型,效率更高。该研究已被2026年国际学习表征会议接收。