Arm发布Cortex-M55、Ethos-U55处理器,为IoT设备带来爆炸性性能提升

全球硅知识产权领导品牌Arm宣布针对机器学习与人工智能应用,推出Arm Cortex-M55处理器与Arm Ethos-U55神经网络处理器(NPU),能够为单片机带来480倍机器学习理论性能提升,或50倍实际应用性能提升,同时提供完整的开发工具,强化低功耗物联网与嵌入式设备AI运算的能力。

Arm台湾总裁曾志光在新品发布会表示,在接下来的5G通信时代中,超高带宽、超低延迟、超大量连接的特色,会大幅改变终端设备、物联网设备以及AI设备的面貌。曾志光提到在始结束的CES 2020拉斯维加斯消费性电子展中,主办单位表示2020年时美国具有5G通信功能的智能手机将占有12%的市场占有率,到了2022年该数据将大幅增长至67%,这除了表示5G手机的普及之外,也代表5G基础建设(如基站)将日趋完善。

举例来说我们的手机可以因为5G通信的超高带宽,用来播放4K甚至8K分辨率的超高分辨率流媒体视频,而性能有限的智能手机,也可以通过流媒体的方式播放由云计算服务器负责运算的AR、VR内容,而车用计算机、车联网也受益于超低延迟,而缩短侦测、预警危险的时间,提升行车安全,超大量连接能力也可满足密集而大量的物联网设备连接的需求。

Arm的目标在于提供搭载AI功能的移动设备、车联网、物联网设备“负担得起”(Affordable)的处理器,由于这类设备的尺寸通常很小,因此成本大多比较低,而且也没有充足的空间安装大容量电池,因此而其中的负担除了价格因素之外,电力消耗也是一大重点。所以压低耗电量,以及提升性能,就是新处理器的2大要务。

曾志光在发布会中分享了许多对5G及AI应用的观点。

小至穿戴设备、智慧家电,大到工业应用、交通运输都能看到AI的踪影。

不同的AI设备会有不同的性能需求,对小型设备而言除了要顾及性能外,电力消耗也是一大考量。

Arm应用工程总监徐达勇则在接下来的演示文稿中,介绍了全新的Cortex-M55处理器与Ethos-U55神经网络处理器,以满足低功耗终端设备的机器学习与人工智能运算需求。

Cortex-M55是第一款采用Arm v8.1-M架构的处理器,并搭载ArmHelium技术Cortex-M矢量延伸指令集(M-Profile Vector Extension,MVE,可以提供高性能与电力效率的矢量运算能力,可以比前代Cortex-M提升5倍DSP(数字信号处理)性能,与15倍机器学习性能。

Ethos-U55则是Arm第一个针对Cortex-M处理器推出的微型NPU神经网络处理器,得以搭配Cortex-M55、Cortex-M33、Cortex-M7、Cortex-M4等处理器使用,可以通过先进的压缩技术,减少电力消耗并显著地缩小机器学习模型尺寸,开发商也可依使用场景选择搭配32、64、128、256组乘积累加运算(Multiply Accumulate,MAC,累加乘法结果的特殊运算单元),提升体积受限的嵌入式与物联网设备之机器学习运算能力。

(笔者注:徐达勇在会后问答中表示,技术上Ethos-U55可以通过共享总线(Shared Bus)搭配任何Cortex-M处理器使用,但基于综性能考量,所以推荐搭配上述处理器。)

徐达勇在会中说明了Cortex-M55与Ethos-U55特色与优势。

Cortex-M55与前代产品相比,能提升5倍DSP性能与15倍机器学习性能。

Cortex-M55最大的特色就是采用Arm v8.1-M架构与搭载Helium矢量延伸指令集。

Ethos-U55则是针对Cortex-M处理器推出的微型NPU神经网络处理器。

从Arm官方提供的理论数据来看,Cortex-M55可以提升15倍机器学习性能,而Ethos-U55则可提升32倍,2者结合后与现有的Cortex- M处理器相比,机器学习理论性能可以大幅提升480倍。但上述的数据毕竟只是理论值,与实际表现一定会有落差,对此Arm官方也提供了在实际环境中所测得的数据。

Arm选择AI语音识别进行测试,测试过程的运算需求包含语音侦测、消除噪音、双麦克风波束成形、回声消除、等化器、混音、关键字侦测、OPUS解码、自动语音识别等项目,单纯使用Cortex-M55可以提升机器学习的推论速度6倍,并提升7倍电力效率,搭配Ethos-U55则能将上述数据分别提升至50倍与25倍,可见其效果十分显著。

这些新产品除了能提升终端设备的运算速度外,Arm也提供Corstone-300参考设计,以及TrustZone、信任固件(Trusted Firmware)、平台安全架构(Platform Security Architecture,PSA)等技术,提升设备的安全性,并加快通过认证所需的手续,以增加产品上市的速度。

Arm也为了增加软件开发的工作效率,提供了集成处理器、DSP、神经网络处理器的软件开发环境,让开发者可以在单一环境中,使用1套编译器、1套调试器完成工作,并不像过去要拆分为3项工作,并依赖3套编译器、3套调试器,可以大幅降低工作复杂度,让开发流程更加流畅。

Cortex-M55搭配Ethos-U55最高能提供480倍机器学习理论性能提升。

在实际应用场景中,也能有约50倍性能提升。

Arm提供多种不同处理器选择,能够满足各种机器学习、人工智能运算需求。

集成式的软件开发环境可以简化并加速开发流程。

Arm也携手芯片制造商、软件商共同构建完整的生态系统统。

Cortex-M55与Ethos-U55的知识产权授权、软件函数库、开发工具现已开始供应,官方估计最快在2021年初就能看到实际搭载这些芯片的产品上市。