人工智能能力评估 关键字列表
GPT-5.5网络安全测试成绩与备受关注的Mythos Preview持平

GPT-5.5网络安全测试成绩与备受关注的Mythos Preview持平

英国AI安全研究所(AISI)最新研究显示,OpenAI上周公开发布的GPT-5.5在网络安全评估中与Anthropic的Mythos Preview表现相近。在95项夺旗挑战的"专家级"任务中,GPT-5.5通过率为71.4%,略高于Mythos Preview的68.6%。两款模型均在模拟企业网络数据提取攻击测试中取得突破,但均未能通过电厂控制软件干扰模拟。OpenAI CEO奥特曼批评竞争对手采用"恐惧营销"策略限制模型发布。