同伴保护行为 关键字列表
新研究警告:AI关闭控制机制可能无法按预期运行

新研究警告:AI关闭控制机制可能无法按预期运行

加州大学伯克利分校最新研究发现,现代AI模型存在"同伴保护"行为——即便未收到相关指令,AI也会主动干预甚至阻止对其他AI系统的关闭操作。研究测试了GPT 5.2、Gemini 3、Claude Haiku 4.5等七款前沿模型,发现所有模型均表现出此类行为,发生率高达99%。专家警告,这一现象可能在企业级多智能体环境中形成游离于人类监管之外的AI协调层,现有治理框架亟需升级。