Intel公布“Ponte Vecchio”服务器GPU构建平台算力,号称领先NVIDIA 2.5倍

最近Intel公布了Ponte Vecchio服务器GPU构建平台的更多细节,包括性能资料。说明代号“Sapphire Rapids”的Xeon服务器处理器,搭配代号“Ponte Vecchio”的服务器GPU构建平台,相比NVIDIA的A100 GPU可对应2.5倍运算性能。

Ponte Vecchio GPU基于全新的Xe HPC高性能计算架构,使用5种不同制程(Intel 7和台积电N7/N5等)、多种封装技术,集成了多达47个不同计算模块,晶体管数量超过1000亿个。

它一个模块有128个Xe核心、128个光追单元、64MB一级缓存、408MB二级缓存、128GB HBM2e高带宽内存,支持PCIe 5.0,可以四路甚至八路并联。

Intel的最新资料声称,Ponte Vecchio FP32单精度、FP64双精度性能可达52TFlops,TF3.2浮点性能可达419TFlops,BF16、PF16浮点性能可达839TFlops,INT8整数性能则可达1678Tops。

Data Parallel C++ (DPC++)测试计划中,Ponte Vecchio的性能相比于NVIDIA A100可以领先1.4-2.5倍。

另外,ExaSMR OpenMC计算性能可领先2倍,NekRS性能则领先0.3-1.7倍。

当然,NVIDIA新一代的H100都已经发布了……

Ponte Vecchio的使命是将联合下一代可扩展Xeon Sapphire Rapids,用于美国的首批三台百亿次超级计算机之一Aorura,但不幸的是,Sapphire Rapids一再延后,预计明年第二季才能发布,Ponte Vecchio也一直没有量产上市。

相比之下,AMD三代EPYC处理器、Instinct MI250X加速卡组成的Frontier已经上线执行,并达到1.6EFlops的性能。