帮SmartNIC找到杀手级应用,Nvidia力推多用途运算卸载技术

在Mellanox旗下产品中,大家较熟悉的是以太网络与InfiniBand的网络适配器、交换机、互联缆线与收发器,在超大规模数据中心、高性能计算领域,占有一席之地。

不过,Mellanox仍有一个系列产品迟迟未受到各界关注,那就是BlueField。这系列产品是在2016年6月问世,后续主打NVMe over Fabrics、SmartNIC等应用,对应存储与网络需求,并称其为可程序化处理器或可程序化适配器。

DPU不再坐冷板凳,定位明确,有望跨入数据中心基础设施领域

到了2018年,Mellanox改以DPU来称呼BlueField。然而,性能比SmartNIC性能更为强大的DPU,实际应用仍难与SmartNIC区隔,直到今年10月,Nvidia终于帮这类产品找到明确的使用定位,还能搭配企业级系统软件平台,实用性有望大增。目前DPU包含哪些产品呢?

BlueField-2

这款DPU产品早在VMware去年8月底举办的VMworld大会期间,就与ConnectX-6 Dx一起亮相,而在本次的GTC大会期间,Nvidia创办人暨首席执行官黄仁勋正式介绍它,并以“芯片上的数据中心基础架构来形容。

在架构上,黄仁勋提到,BlueField-2能够进行安全的运算处理,将应用程序范围,从IT基础设施的范围间隔,可存储加密密钥,并且加速SHA-256认证与加密协议处理,而且能够执行正规表达式与深度封包检测,可用于应用程序识别、入侵防护、网站应用程序防火墙,以及从频外(out-of-band)角度来进行的恶意软件侦测,它也能支持NVMe存储应用,可支持伸缩式区块存储、区块存储加密、重复资料删除、压缩。

Nvidia认为,若纯用中央处理器,提供上述这些功能且达到100 Gbps性能,可能会用到125颗处理核心才足够。

黄仁勋强调,BlueField-2是可程序化的数据中心芯片,Nvidia将长期支持。

DOCA

这是专为BlueField而设的软件开发组件(SDK),其中集成了多种开放API,像是用于网络的DPDK、用于存储的SPDK、用于封包处理的P4,以及Nvidia发展的CUDA、AI软件应用。

如何让DPU能够支持更多应用,软件支持的发展将是关键。黄仁勋特别以他们长期发展的CUDA来类推DOCA,表示两者具有同样性质,并称其为可程序化数据中心基础设施处理器架构,开发者可用它来撰写软件定义网络系统、软件定义存储系统、网络安全防护系统、遥测(远程集中管理),以及网络内运算(In-Network Computing)。

他强调,DOCA将完全兼容与无缝集成到主要的操作系统及Hypervisor,而基于DOCA写成的应用程序,可执行在BlueFileld-2及后续BlueField版本。

另一个DPU前景看好的消息,是Nvidia与VMware在9月底宣布的合作,该项计划称为Project Monterey,黄仁勋也在隔周举行的GTC大会重申此事,因为这项计划能否奏效的关键正是Nvidia DPU。他说,“我们要将VMware移植到BlueFiel d上,诚如BlueField是数据中心基础设施的处理器,而VMware是数据中心基础设施的操作系统,我们的合作将重新定义数据中心。”他强调,Nvidia能将虚拟化、网络、存储、安全等工作,卸载到BlueField,实践分布式的零信任安全运算,让全球数千万台服务器的性能与安全防护,获得大跃进。

基于双方的合作,有机会将软件定义数据中心的架构提升至新的境界,若要促成这样的发展,两家公司都是关键,因Nvidia握有BlueField-2资料处理器、DOCA软件开发组件,VMware掌控操作系统平台,各拥有可程序化数据中心基础设施平台的一部分。

Nvidia牵线,系统软件厂商与服务器企业都将支持

为了拓展DPU的应用,Nvidia也找来许多厂商与其合作。举例来说,与VMware合作研发的Project Monterey,将促使软件定义数据中心平台VMware Cloud Foundation(VCF)支持SmartNIC/DPU技术,他们也将针对VCF进行重构,实现服务器处理的分散运行,并支持裸机形态的服务器部署。在这样的架构下,应用程序的工作负载可执行在一台实体服务器,所耗用的协同处理器硬件加速资源,则是坐落在其他实体服务器,分散负载。

同时,ESXi这个Hypervisor虚拟层会执行在SmartNIC/DPU其中,VMware表示,不只是ESXi,连带存储虚拟化平台vSAN、网络虚拟化平台NSX,都是直接执行在SmartNIC其中的Arm处理器,而且是处于持续(persistent)执行状态,但此时企业仍然可用单一管理框架来控制所有运算基础设施,并将网络、存储、安全防护等功能,从原本需集中在主要的服务器执行,改而释放到SmartNIC/DPU执行,因此,这些功能的漏洞修补与升级作业,可独立于服务器之外执行,无需与Hypervior相依。

Project Monterey能否顺利推动,除了要克服技术层面的挑战,厂商、市场生态系统统的支持也是关键,而这项计划的主要成员,目前除了VMware、Nvidia,还有英特尔、Pensando Systems,戴尔科技集团、HPE、联想等服务器厂商也将基于这个计划,推出集成系统。

单就BlueField-2而言,Red Hat、Canonical这两大Linux OS开发商,计划或宣布支持BlueField-2。网络防火墙厂商Check Point也宣布集成BlueField-2,该公司旗下的Infinity Next Nano Agent代理程序软件搭配DPU之后,可在不需损耗服务器CPU资源的状态下,针对服务器进行微分段(Micro- Segmentation t)等多种安全防护。

在硬件服务器的部分,Nvidia也号召多家厂商与其合作,华硕、Atos、戴尔科技集团、富士通、技嘉、新华三、浪潮、联想、广达/云达、Supermicro等公司,都计划推出集成DPU的服务器。

若要发挥DPU的潜能,能否获得足够的软件兼容性与相关支持,将会是另一个关键,Nvidia在此提供了DOCA架构,其中包含多种加速处理的软件开发组件。

为了拓展DPU的企业级应用与提升服务器虚拟化平台的性能,Nvidia与VMware展开密切合作,他们将通过“Project Monterey”,让DPU能够以持续的方式执行VMware的ESXi、vSAN、NSX,如此可从原本过于集中于服务器端CPU的架构,转为搭配DPU的分散、协同处理架构。