英特尔调翻新一代Xeon服务器平台到底是为了什么事?

1998年6月29日正式诞生的英特尔(Intel)“Xeon”处理器品牌,因代表高利润服务器与工作站产品线,靠着20世纪末期互联网时代到来,以及21世纪初期云计算数据中心增长,成为英特尔最主要的现金母牛与获利来源,且几乎不受外在环境影响,包含肆虐全球的新冠肺炎。

这20年来,即使英特尔处于低潮,如NetBurst魂断10GHz时脉大梦、进军移动运算市场惨遭滑铁卢、14纳米制程“挤牙膏”挤到产品大缺货,但标上Xeon的英特尔处理器,依旧注资源源不绝的丰沛营收。讲白一点,英特尔再怎么不务正业、胡搞瞎搞、发动x86义和团之乱、PC机被AMD打个满头包,数据中心和服务器业务相关的业务群,依然让英特尔继续发大财。

AMD K8在2003年侵入服务器市场,能对英特尔造成空前绝后的巨大威胁,也是因为Opteron这个品牌,挟着以64位元x86指令集为首的众多技术优势,曾经一度和Xeon平起平坐,让AMD首尝服务器市场的甜头。截至目前,从2017年开始让AMD“重返荣耀”的EPYC,也尚未重回Opteron在2003~2009年的美好繁荣,怎么看都差得远了。

但关于英特尔的新时代Xeon处理器,今年初却传出不太妙的谣传:接替现有Purley平台的新一代双Xeon处理器平台“Whitley”,前期采用的第四代14纳米制程(意思就是挤了3次牙膏)Cooper Lake-SP处理器,惊传遭取消。

乍看之下,这是英特尔“知耻近乎勇”直接迈向第二代10纳米制程的勇敢决定,但这事情并不单纯,一个弄不好,足以撼动支撑英特尔20年的地基。

Google提出的Bfloat16(BF16,Brain Floating Point)浮点格式,是近来深度学习应用新宠,让众多芯片厂商趋之若骛,魅力无法挡。

BF16介于半精度FP16与全精度FP32,指数(Exponent)和FP32相同,保留近似的动态范围,但小数(Fraction)部分较少,能让开发者在16位元的空间内,通过降低精度获取更大数值空间,并能降低浮点运算器的电路复杂度(浮点乘法器的尺寸,会随着小数宽度的平方而增加),大幅节省芯片面积,或在相同的芯片面积内,塞入更多浮点运算器,提升运算速度。

所以英特尔2019年6月首次公开披露Cooper Lake和Ice Lake的AVX-512添加指令时,就引发“在14纳米末代服务器处理器支持BF16,然后又在10纳米时代砍掉”的质疑。

更何况,英特尔在2018年7月宣布中止Xeon Phi产品线后,就缺乏对应BF16的标准处理器产品,这背后一定暗藏重大的策略考量,例如某个极为重要的客户(或许英特尔原本就当成Xeon Phi 7200“Knights Mill”系列的首选目标),急着要在深度学习应用部署BF16运算平台。

当初外界也不乏“Ice Lake的服务器版本,也有可能追加BF16”的猜测,但英特尔今年3月更新的x86指令集扩展文件,很明确宣示:BF16仅限Cooper Lake(Cedar Island平台)和Sapphire Rapids(Whitley后面的Eagle Stream平台,10纳米++ 制程),Ice Lake的服务器版,没有BF16。

到头来,英特尔想干么?那个神秘客户又是谁?

首先,Cooper Lake-SP虽然遭取消,但Cedar Island平台的Cooper Lake-P处理器仍保留,反正AMD也没有可与之竞争的产品(目前EPYC只有双处理器组态,再往上就付之阙如)。换言之,如果客户坚持要有提供BF16的Xeon,并非没有选择。

其次,英特尔为何要腰斩48核的Cooper Lake-SP?这很可能跟它是包两颗24核芯片(甚至有可能3颗,像AMD一样把内存控制器与I/O独立出来)导致过热有关。同样靠着包两颗Cascade Lake-SP凑到48核的Xeon Platinum 9242,标准功耗就高达350W,在14纳米制程换汤不换药的前提下,我们应该没有充分信心,相信Cooper Lake- SP可压低到300W以内。

况且,AMD预定今年第三季上阵的第三代EPYC“Milan”,除了与前代共享SP3脚座,将使用台积电EUV 7纳米制程,也确认改良后的Zen 3核心与容量激增的第三阶缓存内存。而Milan将引进HBM这种神兵利器、会有“包10颗CCD的80核版本”之类的恐怖传言,更从来没有停歇过。

总之,论账面规格和价格弹性,英特尔新一代Xeon平台能否占到任何便宜,仍是问号。将双处理器(Whitley)和4 / 8脚座处理器(Cedar Island)分而治之,更充分彰显英特尔已经正视挑战,准备正面迎击AMD的决心。毕竟英特尔再继续挤牙膏下去,连在数据中心领域长期享有的强势地位,都将面临危机。

当然,商业竞争的胜负并非只取决于产品技术的优劣,从“创建生态系统统”、“稳固伙伴关系”一路到台面下的各类威胁利诱(今年英特尔大概又有发不完的营销发展基金和芯片采购回扣了),英特尔手上能动用的武器与资源,绝对远胜AMD,从2019下半年开始,在各大服务器系统厂启动的“Design In”,英特尔新开案数远多于AMD,也不会是太令人意外的结果。但假若英特尔在10纳米制程服务器处理器没踏稳第一步,AMD要重现昔日Opteron的荣光,好像也不是如此遥不可及。

最后,扯了这么多,那个英特尔眼中重要到极点的客户,到底是谁?

听说是创办人的老婆是华人、又带头发起OCP(Open Compute Project)的那间又有脸又有书的公司。不过笔者更好奇的是,据闻他们去年7月就收到Cooper Lake-SP的样品做测试,不知效果如何?真的有这么热吗?

至于现在四处摇旗呐喊“英特尔已被AMD打趴到地上按着头摩擦”、“台积电先进制程天下无敌万万岁”的网络乡民和科技文青,笔者只能对他们说一句:别跟我讲这么多,等AMD夺回30%的x86服务器市场,再来叫我。

(首图来源:Jud McCranie/CC BY-SA)