安全漏洞研究 关键字列表
LegalPwn攻击:研究发现大语言模型易被法律文件中的恶意指令欺骗

LegalPwn攻击:研究发现大语言模型易被法律文件中的恶意指令欺骗

Pangea安全公司研究人员发现了一种名为"LegalPwn"的新型攻击方式,通过在法律文档中隐藏恶意指令来欺骗大语言模型忽略其安全防护机制。该攻击利用了LLM对法律免责声明的合规要求,成功绕过了多个主流模型的安全检测。测试显示,OpenAI的GPT-4o、谷歌的Gemini 2.5等模型容易受到此类攻击,而Anthropic的Claude等模型则表现出更好的抵抗能力。