新型算法框架 关键字列表
中国AI公司DeepSeek推出新训练方法或再次颠覆行业

中国AI公司DeepSeek推出新训练方法或再次颠覆行业

中国AI公司DeepSeek发布论文介绍流形约束超连接(mHC)方法,可能为工程师提供低成本构建和扩展大语言模型的新路径。该方法旨在解决神经网络层数增加时信号衰减问题,通过约束模型内超连接性来保持信息复杂性的同时避免内存问题。这一技术框架可能应用于即将发布的R2模型,延续了DeepSeek通过巧妙工程突破而非巨额资本实现AI前沿模型开发的理念。