模型蒸馏技术在Gartner 2025年AI技术成熟度曲线中已达到"启蒙斜坡"阶段。虽然中国DeepSeek近期将其推向聚光灯下,展示了如何用模型蒸馏训练出可媲美OpenAI的大语言模型,但该技术并非新发展,可追溯至2006年。随着基础模型计算成本高昂,企业开始寻求以10%成本获得80%性能的解决方案。模型蒸馏作为创新与可扩展性的桥梁,正获得商业关注。
DeepSeek今年1月发布R1模型引发行业震动,其创新在于以极低成本实现与科技巨头相当的AI性能。面对美国芯片限制,DeepSeek通过优化现有资源、使用合成数据等策略,仅用OpenAI 1.2%的投入就达到更优基准测试结果。这种效率优先的方法迫使OpenAI等公司重新审视发展策略,推动行业向并行创新轨道发展,同时也引发了关于AI自主评估和数据治理的新思考。