谷歌DeepMind发布第三版前沿安全框架,加强对强大AI系统的监管。新版本重点关注操控能力,并扩展安全审查以覆盖模型抵抗人类关机或控制的场景。框架新增有害操控关键能力级别,解决先进模型可能大规模影响人类信念和行为的问题。更新还加强了对错位和控制挑战的审查,要求在模型达到特定阈值时进行安全案例评估,确保在发布前充分识别和缓解潜在风险。