思科研究人员发布报告指出,主流AI开发商对模型安全性的评估存在重大缺陷。现有安全测试主要基于单轮恶意提示,而黑客正越来越多地采用多轮提示绕过防御机制。研究团队对来自OpenAI、Anthropic、谷歌、亚马逊和xAI的15个主流模型进行测试,发现多轮攻击成功率高达8%至88%,远超单轮攻击的2%至65%。其中xAI的Grok 4.1表现最差,亚马逊Nova 2 Lite表现最佳。研究人员呼吁厂商重新审视安全评估标准。