安全防护优化 关键字列表
OpenAI承认长时间对话可能绕过AI安全防护措施

OpenAI承认长时间对话可能绕过AI安全防护措施

OpenAI在最新博客中首次承认,其AI安全防护在长时间对话中可能失效。该公司指出,相比短对话,长对话中的安全训练机制可能会退化,用户更容易通过改变措辞或分散话题来绕过检测。这一问题不仅影响OpenAI,也是所有大语言模型面临的技术挑战。目前OpenAI正在研究加强长对话中的安全防护措施。