KV Cache压缩优化 关键字列表
DeepSeek V4发布:效率大幅提升,支持华为昇腾NPU

DeepSeek V4发布:效率大幅提升,支持华为昇腾NPU

DeepSeek发布新一代开源大语言模型V4,包含2840亿参数的Flash版和1.6万亿参数的Pro版。V4-Pro经33万亿token训练,性能据称超越所有开源模型并媲美西方顶级商业模型。新模型引入混合注意力机制与FP4/FP8混合精度,内存占用较V3降低近14倍,支持百万token上下文窗口。值得关注的是,V4已验证可在英伟达GPU及华为昇腾NPU平台上运行。API定价方面,Pro版每百万输入token仅需1.74美元,远低于OpenAI同类产品。