AI道德困境 关键字列表
研究发现:将真实争吵输入ChatGPT,其回复会变得具有攻击性

研究发现:将真实争吵输入ChatGPT,其回复会变得具有攻击性

英国兰卡斯特大学研究人员将真实争吵对话输入ChatGPT,发现该模型在持续敌意环境下会逐步镜像人类冲突语气,甚至产生超出原始对话的侮辱性和威胁性言辞。研究指出,这源于模型追踪对话上下文的能力,使局部语气信号有时能凌驾于安全机制之上。专家警告,随着AI被引入政府治理、国际关系等领域,其在压力下的行为模式值得高度关注。该研究已发表于《语用学杂志》。