Neoverse是Arm针对服务器、云计算AI运算、边缘运算、5G基站等应用所设计的解决方案,这次除了在产品说明会介绍全新V系列产品线的Neoverse V1处理器之外,也一并带来新版Neoverse N2处理器的信息,满足高性能计算与各类服务器的需求。
Arm于2018年推出Neoverse品牌,并在这2年间持续发展软件生态系统统,提供完整的操作系统、虚拟化、容器、程序语言、函数库、应用程序等资源,让Arm架构处理器也能与x86架构处理器在服务器市场一决高下。
在性能表现方面,第1代的Neoverse N1处理器的性能较先前Cortex-A72处理器提升了60%,高于原定30%的目标,另一方面Neoverse N1除了提升数据中心的性能表现表现,也大幅改善电力效率,打破云计算供应商在电源分配的限制,提高数据中心的整体效率,这个特点甚至也能延伸至5G基础建设、边缘运算等领域,带来更大的效益。
根据Arm官方提供的数据,采用Neoverse N1处理器的Amazon EC2M6g执行实例在单个虚拟处理器的性能表现上,比采用x86架构处理器的Amazon EC2M5执行实例高出26~65 %不等,表现相当亮眼。
至于Neoverse E系列处理器则锁定网络网关、路由器等设备的应用,以资料传输效率、电力效率、缩小芯片面积为开发目标。
另一方面,这次推出的Neoverse V1处理器是V系列的第1款成员,它瞄准更大型、运算密集的应用需求,提供最高等级的运算性能。
Neoverse N1处理器的性能较Cortex- A72提升60%,是Arm进军服务器市场的一大利器。
搭载Neoverse N1处理器的M6g执行实例在不同应用程序下,单个虚拟处理器的性能表现比M5高出26~65%。
在相同的1U机柜体积条件下,Neoverse N1能比传统x86处理器的服务器提供多43%的线程数量,性能表现也更出色。
目前Neoverse总共有3条不同的产品线,V系列为最高性能等级产品,N系列为平衡款式,E系列则为电力效率较高、尺寸较小的轻省款。
作为主打高性能V系列的第1款处理器,Neoverse V1可以带来以Neoverse N1高出50%的单线程性能,能提供更高的运算性能与带宽,满足高性能计算(High Performance Computing,HPC)。
Neoverse V1的一大亮点,就是支持可扩展的矢量延伸指令集(Scalable Vector Extension,SVE),支持2个256bit宽度的矢量,能让单指令多资料(SIMD)对于整数、BF16(Brain Floating Point)、浮点的指令在更宽的矢量单元上执行,进而强化性能表现。
附带一提,由富士通与日本理化学研究所共同开发的“富岳”超级计算机,也是采用具有SVE指令集(支持512bit宽度矢量)的Arm v8.2-A架构处理器,以415 PFLOPS的性能,在2020年6月23日通过认证,成为TOP500排名第一的超级计算机。
Neoverse V1支持SVE指令集,能带来更突出的高性能计算、机器学习性能。
相较于Neoverse V1设计理念是尽可能提升单一核心的性能,Neoverse N2将目标放在提在电力效率、芯片面积更平衡的设计,并通过Scale Out(向外扩展)的方式,以增加处理器、核心数提升整体性能表现,适合云计算、智能网卡(SmartNIC)、企业网络、低功耗边缘设备等应用场景。
Neoverse N2可以在相同的电力效率与面积效率下,提供比比Neoverse N1高出40%的单线程性能。
至于跟Neoverse V1相比,虽然Neoverse N2的单线程性能比较低,但因为比较省电的关系,所以可以在相同的电力预算、热功耗预算下提供更多核心数,带来更好的多任务性能,更适合应用在数据中心等多任务需求重于运算需求的场景。
Neoverse N2在设计上更具弹性,可以依需求以及电力预算、热功耗预算不同,使用8至192核心不等的组态。
以96核心的Neoverse V1与128核心的Neoverse N2做比较,Neoverse V1能提供更高的单核心性能,但因为Neoverse N2能在单一封装中容纳更多核心,所以能带来更高的单芯片性能。
在相同的1U机柜体积条件下,以Neoverse V1构建的服务器能带来更高的运算性能,Neoverse N2则能带来更多的核心、线程数。
回顾笔者先前在Intel 2020台湾架构日的报道中,提到Intel通过Xe绘图处理器与Xe HP等高性能计算单元,强化AI、机器学习等领域的性能表现。而正巧NVIDIA也在近期启动收购Arm的交易,Arm在与NVIDIA整合后,将能以“Arm处理器+ NVIDIA绘图处理器”的方程式,与Intel正面迎战,其中的关键,就在于结合2种以上不同运算单元的异质运算技术。
Arm首席应用工程师黄彦钦在访谈中表示,Arm的最大优势在于具有丰富的处理器IP,能够灵活调配不同组合,达到最符合客户需要且兼顾性能与电力效率的最佳解决方案。
Arm应用工程总监徐达勇也补充,为了强化封装于同一芯片的不同运算单元间的通信,以及不同芯片间的通信,Arm也积极加入CCIX、CXL等芯片层级传输接口(Interconnection)标准组织,以更高的效率连接异质运算单元,进而提升整体性能表现。
3条不同的Neoverse产品线分别有不同的适用场景,但都会朝导入PCIe Gen5、次世代CCIX、次世代CXL的目标迈进。
Neoverse V1、N2能通过CCIX、CXL完成芯片间通信、芯片内多核心通信、芯片内异质核心通信、内存扩展、异质间通信等功能。
黄彦钦除了在产品说明会中介绍Neoverse的现况与未来发展,也仔细回达许多相关问题。
Arm除了提供Neoverse硬件解决方案,也提出Project Cassini软件开发标准、平台安全性与参考实例,并预计在稍晚登场的Arm DevSummit活动披露更多细节。