ENERZAi团队成功在高通QCS6490 Hexagon NPU上通过QNN部署了BitNet (b1.58) 2B模型。BitNet b1.58是微软研究院提出的大语言模型架构,采用三值权重(-1、0、+1)表示,极大压缩了模型体积,适合边缘端部署。由于高通QNN等主流NPU SDK不支持BitNet的三值运算,ENERZAi通过自研1.58位定制内核,成功突破这一限制,为未来在NPU上运行80亿参数以上模型奠定了基础。