模型逆向工程 关键字列表
研究员将OpenAI开源大语言模型逆向还原为无推理"基础模型"

研究员将OpenAI开源大语言模型逆向还原为无推理"基础模型"

Meta研究员Jack Morris成功将OpenAI的gpt-oss-20B模型逆向工程为基础版本,去除了推理行为和安全对齐限制。通过在三个层面应用LoRA技术,仅训练0.3%的参数,就恢复了模型的原始文本生成能力。新模型响应更快、更自由,但也带来安全风险。这项工作展示了开源模型发布后如何被快速改造,为研究偏见、记忆化等问题提供了新工具。