新智元报道  

 新智元编辑部

【新智元导读】9月2日,华为在德国 IFA 2017 现场重磅发布全球首款麒麟 970移动计算平台,引起业界广泛关注。华为在发布会现场没有透露的是:其背后的 AI 芯片来自何方?技术支撑来源于何处?中科院计算所工作人员向新智元披露了一份致华为的贺信,证实华为麒麟970的NPU就是寒武纪的IP。

华为发布 AI 移动计算平台麒麟 970,NPU成焦点

9月2日,在德国IFA 2017举办期间,华为正式发布全球首款人工智能移动计算平台麒麟970。 除了用一系列性能数据大秀肌肉以外,华为消费者 BG CEO 余承东在演讲中提出了华为的人工智能发展战略:Mobile AI=On Device AI + Cloud AI,即人工智能在未来终端上的实现必须通过端云协同。

麒麟970具体参数

余承东表示,这一带有强大AI计算力的手机端移动计算平台,是业界首颗带有独立NPU(Neural Network Processing Unit)专用硬件处理单元的手机芯片。 

以下是关于麒麟 970 的一些详细介绍:

1. 经过十年研发,麒麟970采用了行业高标准的TSMC 10nm工艺,集成了55亿个晶体管,功耗降低了20%,并实现了1.2Gbps峰值下载速率。

2. 创新性集成NPU专用硬件处理单元,创新设计了HiAI移动计算架构,其AI性能密度大幅优于CPU和GPU。相较于四个Cortex-A73核心,处理相同AI任务,新的异构计算架构拥有约 50 倍能效和 25 倍性能优势,图像识别速度可达到约2000张/分钟。

3. 麒麟970高性能8核CPU,对比上一代能效提高20%。率先商用 Mali G72 12-Core GPU,与上一代相比,图形处理性能提升20%,能效提升50%,可以更长时间支持3D大型游戏的流畅运行。

另外,华为方面表示,将会把麒麟作为人工智能移动计算平台开放给更多的开发者和合作伙伴。

麒麟970关键架构 NPU 究竟来自何方?

麒麟970的一些关键数据:

  • 使用10纳米工艺

  • 1平方厘米有55亿个晶体管

  • 8核CPU:4个A53(最大功率1.8GHz)+ 4个A73(最大功率2.4 GHz)

  • 12核GPU(Mali G72MP12)

  • LTE Cat. 18 mit bis zu 1.2 GBit/s

  • 双ISP图像处理

  • 为移动端AI设计的计算架构 NPU,也即这次麒麟970最受关注、华为宣传力推的神经网络处理单元

回顾麒麟970发布现场提供的芯片架构,不难发现麒麟970在AI任务上的超强表现,主要还是得益于异构架构中的NPU。NPU 峰值性能 1.92 TFLOPs FP16(半精度),直观一点看,华为内部测试结果,集成了NPU后的麒麟970每分钟能处理2005张图像(没有NPU每分钟97张图像)。凭借其在性能和能效比上的优秀表现,NPU可谓支撑麒麟970智能计算真正意义上的“大脑”。

那么这个大脑来自哪里,就成了不可忽视的问题。

业界普遍猜测,NPU正是顶尖AI芯片企业寒武纪科技去年发布的寒武纪1A处理器(Cambricon-1A Processor)。根据寒武纪科技公开的宣传材料,这款处理器是国际上首个商用深度学习处理器产品,拟以IP(知识产权)授权的方式进入下游厂商SoC芯片。如果上述猜测属实,华为背后的AI赋能者应该就是这家AI芯片领域的新晋独角兽——寒武纪。

2017年4月,媒体报道称,寒武纪研发了国际首个深度学习专用处理器芯片(NPU),当时其IP指令集,已扩大范围授权集成到手机、安防、可穿戴设备等终端芯片中,2016年就已拿到亿元订单。

NPU背后有一个关键词是寒武纪,为什么这么说?我们有一封公开信:

来自中科院计算所的贺信,证实华为麒麟970的NPU就是寒武纪的IP

本文发稿前,中国科学院计算技术研究所工作人员向新智元披露如下贺信内容,证实了华为麒麟970的NPU就是寒武纪的IP。(贺信内容以计算所的正式文件为准,个别地方可能会有修订)

华为技术有限公司、深圳市海思半导体有限公司:

欣闻贵公司于2017年9月2日在德国柏林正式发布了集成深度学习处理器的新一代手机芯片麒麟970。这一手机发展历程中里程碑式的事件,标志着手机开始进入智能时代。这是贵公司持续创新取得的丰硕成果,中国科学院计算技术研究所向贵公司全体同仁致以最热烈的祝贺!

自2011年以来,贵公司和我所开展了深入的合作,组建了“中科院计算所-华为联合实验室”。这种高水平研究所+领导性公司的合作模式,取得了丰硕的成果,在计算和通信技术领域做出了一系列有国际影响力的工作,开辟了一条极具特色的产学研用深度融合的道路。

我所是中国最早从事计算机科学技术研究的综合性学术机构,被誉为“中国计算机事业的摇篮”,在深度学习处理器领域的学术研究一直处于国际领先水平,得到国内外同行的广泛认可;我所企业寒武纪公司(Cambricon Technologies)研制并具有自主知识产权的“寒武纪1A深度学习处理器”(Cambricon-1A Processor)是国际上首个商用深度学习处理器产品,在人工智能应用上达到了四核CPU 25倍以上的性能和50倍以上的能效。此次,麒麟970芯片集成寒武纪1A处理器作为其核心人工智能处理单元(即余承东总在发布会中所述NPU),实现了手机上本地、实时、高效的智能处理。作为世界首款集成人工智能专用处理器的手机芯片,麒麟970将为全世界广大手机用户带来智能时代颠覆性的用户体验,引领全世界智能手机发展的新潮流。

贵公司秉承积极开创的企业精神,创造了一个又一个手机芯片研发和产品化的奇迹,为世界通信技术的发展做出了巨大贡献,是中国信息产业在全球的杰出代表,是值得国内同行尊重和推崇的榜样。作为华为的长期合作伙伴,我们为麒麟970的成就感到由衷的骄傲,也为寒武纪公司在智能处理器产品化方面做出的成绩深感欣慰。我们坚信,华为和寒武纪的强强联合,必将成为世界手机发展史和智能芯片发展史中的里程碑事件,成就中国信息产业的一段佳话。

再次祝贺贵公司的杰出成就。预祝贵公司在智能时代的计算和通信产业中,为全人类做出更大的贡献! 

中国科学院计算技术研究所

2017年9月

麒麟970是否意味中国AI芯片技术已经走在世界前列 ? 

根据腾讯研究院公布的数据,中国人工智能企业数量已经达到592家,占据全球人工智能企业总数的23%,仅次于美国。国内智能手机的普及伴随着移动网络的高速发展,无疑为人工智能的发展提供了优质的数据资源和多样的应用场景。这样看来,AI芯片企业具有相当可观的发展空间。这是否意味着国产芯片迎来了春天?可以一举在国际芯片行业实现“弯道超车”?   

有业界人士认为,顶尖企业之间的战略合作,完善的知识产权保护也是构建AI生态的关键因素。寒武纪在这一点上已经走在了很多国内芯片厂商的前面。寒武纪CEO陈天石过去在接受采访时曾经提到,“芯片的成败,除了本身的效率之外,生态是非常关键的环节。没有配套的应用和软件,很难在市场上获得成功。这就是为什么我们提出了国际上首个AI指令集。只要国产AI指令集立住了,中国主导世界AI产业的机会可能就到来了。”

新智元也在麒麟970发布后第一时间联系寒武纪科技,但截止本文发稿之时,寒武纪科技尚未作出回应。

华为和寒武纪的合作,将对构建国内企业的AI生态提供了重要的参考价值。专业人士表示,龙头企业数量和企业研发能力方面,中美两国还有一定的差距。人工智能可能是实现换道超车的机会,但真要实现起来还需要更多国内企业共同参与、共同努力。

针对此事,新智元了解到,华为公开的说法是:“华为和寒武纪团队共同面向终端,在 AI 方面进行了联合开发与优化。麒麟970创新设计了HiAI移动技术架构,利用最高能效的异构计算架构来最大发挥CPU、GPU、ISP、DSP、NPU的性能。NPU是麒麟970异构计算的一部分。华为对麒麟970异构系统中的每个处理器都非常重视,在CPU、GPU、ISP、DSP上都投入了重要力量进行技术开发和探索,投入大量力量进行优化,力求带来最好的效果。”