Intel公布“Ponte Vecchio”服务器GPU构建平台算力，号称领先NVIDIA 2.5倍

最近Intel公布了Ponte Vecchio服务器GPU构建平台的更多细节，包括性能资料。说明代号“Sapphire Rapids”的Xeon服务器处理器，搭配代号“Ponte Vecchio”的服务器GPU构建平台，相比NVIDIA的A100 GPU可对应2.5倍运算性能。

Ponte Vecchio GPU基于全新的Xe HPC高性能计算架构，使用5种不同制程(Intel 7和台积电N7/N5等)、多种封装技术，集成了多达47个不同计算模块，晶体管数量超过1000亿个。

它一个模块有128个Xe核心、128个光追单元、64MB一级缓存、408MB二级缓存、128GB HBM2e高带宽内存，支持PCIe 5.0，可以四路甚至八路并联。

Intel的最新资料声称，Ponte Vecchio FP32单精度、FP64双精度性能可达52TFlops，TF3.2浮点性能可达419TFlops，BF16、PF16浮点性能可达839TFlops，INT8整数性能则可达1678Tops。

Data Parallel C++ (DPC++)测试计划中，Ponte Vecchio的性能相比于NVIDIA A100可以领先1.4-2.5倍。

另外，ExaSMR OpenMC计算性能可领先2倍，NekRS性能则领先0.3-1.7倍。

当然，NVIDIA新一代的H100都已经发布了……

Ponte Vecchio的使命是将联合下一代可扩展Xeon Sapphire Rapids，用于美国的首批三台百亿次超级计算机之一Aorura，但不幸的是，Sapphire Rapids一再延后，预计明年第二季才能发布，Ponte Vecchio也一直没有量产上市。

相比之下，AMD三代EPYC处理器、Instinct MI250X加速卡组成的Frontier已经上线执行，并达到1.6EFlops的性能。