AMD耕耘多年的技术反击力道

Xeon身为x86处理器主宰服务器市场的象征及英特尔20年来的“现金母牛”(Cash Cow),早已是科技业界众所皆知的常识,但你会相信英特尔的财报,会出现“服务器的净利低于个人计算机”那天吗?

这世上有些事情,即使发生了重大的改变,也不会很快就看到效应,尤其对于“动量”很大的服务器市场来说,更是如此。不过一旦发生,那影响就会持续很多年。以曾经靠着Opteron爽很久的AMD为例,在2008年开始就失去产品竞争力,但也死撑活撑到了2012年,停止了“正统”服务器产品线的发展,才算是被彻底逐出了市场,直到2017年的EPYC才重新反攻服务器的战场。

根据英特尔本季财报,2021年第一季营收197亿美元,比去年同期下降了1%,净利却相比去年同期57亿美元大幅下降了41%,仅仅34亿美元,主因在于“数据中心业务营收仅56亿美元,比去年同期减少20%”。更刺激的还在后面,数据中心业务的净利,在去年还有50%,今年却仅剩下23%,还远低于个人计算机的39%(去年43%)。

(Source:英特尔)

你眼睛绝对没有看错,你可以再看一次,笔者等你。

基本上除了“业力引爆”,笔者实在想不出更贴切的描述了。就笔者印象所及,英特尔新任首席执行官Pat Gelsinger在2005年底,从首席技术官转任数字企业业务群总经理时,面对的处境好像还没有这么惨烈,那时还是AMD吃下30% x86服务器市场市场占有率的全盛期。

但这背后却涉及大环境变迁,笔者就曾经亲眼见证过某云计算巨头的新建数据中心标案,把某颗牌价1,499美元的处理器,砍到599美元的惨案。笔者2017年夏天的《为何AMD近十年x86 CPU打不过Intel?战局会改观吗? 》文中的“AMD抢滩的希望在云计算数据中心,而非传统套装服务器”这段,提到几个重点:

Google与云计算服务的崛起,大举重塑了传统服务器市场的生态:云计算服务企业为了降低运营成本,数据中心的硬件大多自行设计量身订做,再发包给系统代工企业,等于跳过传统服务器大厂与白牌服务器这关,采购处理器直接与供应商议价,借由一次性的巨量需求,大幅压低采购单价到外人难以像像的程度。

所以AMD一开始替EPYC设置开辟第二战场的抢滩登陆点,就是云计算数据中心,而非传统套装服务器市场,才更有机会冲高出货量和市场占有率,这从诸多产品规格特性,如8信道Unbuffered DIMM,弹性化的PCIe组态,无需插件系统芯片组就有一定水准的I/O界面可用,加装安全加密机制等,与核心设计上的取舍,像精简SIMD指令集运算单元,就可以看得一清二楚,一切为降低成本而生,你要32核心我就包4颗8核的水饺给你,甚至连芯片品质需不需要像以前那么可靠,都可能存在商量余地,至于能不能正面在所有应用场合战胜Skylake-SP,其实不见得那么重要。

讲的更白一点,EPYC表面上是一台2路服务器,但AMD实际上卖的,却是一台便宜的高密度8路系统。笔者只能说Intel花一堆工夫做那20几页演示文稿数落AMD EPYC的不是,完全在打空气,但即使Intel心里明白,不会更不能说出来。

如果AMD服务器市场占有率还是没有突破10%,甚至重回昔日30%高峰,那还真的会让投资人和AMD粉丝无语问苍天。

现在让我们回头瞧瞧这两家公司千呼万唤始出来的“新品”和英特尔对AMD发动的营销反击。

新冠肺炎搞得全球科技业出现史无前例大缺料、搞得一堆产品纷纷延期的高峰,3月15日,AMD“终于”发布Zen 3微架构第三代EPYC处理器(代号Milan),也理所当然的,AMD宣称最多64核心的EPYC 7003系列是“全球最好的数据中心芯片”。

至于性能经过完善调校后的Zen 3,IPC比Zen 2的多出19%这种连“光华牌工程师”和科技宅都该知道的基本常识,就不必浪费文本赘述了。就目前看来,假如谣传都是真的,补回AVX-512指令集和BF16浮点格式的AMD的Zen 4才值得受到真正的关注,因为届时EPYC才有真正全面挑战Xeon-SP的本钱。

4月7日,历经“Cooper Lake-SP之乱”与一再延误的10纳米制程,原本英特尔去年夏天HotChips 32开开心心发布的第三代Xeon-SP平台“Whitley”与Ice Lake-SP(ICX)处理器,被正式宣布推出,像超出预期的单芯片最多40核心(虽然还是输给AMD一大截)、Sunny Cove微架构提升20% IPC(这也是本来大家都清楚的事情)、比28核的前代多出46%的数据中心负载性能、提高74%的人工智能推理性能、平均性能比“五年前”Broadwell老系统增加2.65倍,以及“惯例性”的添加人工智能与密码学相关指令等,也都让人丝毫提不起劲。

但英特尔还是发动了久违的“演示文稿大作战”,也专挑AMD无法还手的项目,像Chiplet多芯片封装“水饺”难以避免的远程缓存访问等(但严格说来,第二代和第三代EPYC已比初代改善不少)。

AMD基于种种因素(提高生产效率、降低制程风险、减少NUMA Domain),将内存控制器移出处理器晶粒,难以避免的额外访问延迟,也变成英特尔攻击的重点。

添加指令集这档事就没啥好解释了,一翻两瞪眼,先抢先赢。

都用上AMD没有的AVX-512和一堆添加指令,性能不赢才奇怪。

以Google等云计算服务企业的逻辑来翻译英特尔的说法:云计算服务企业须最短的服务反应时间,让客户有机会接触更多的广告,所以应该选择他们家“Optimized for the cloud”的产品,除此之外,讲再多,都是多余。 “人工智能优化”?假若讲讲推论也就算了,光看在缺乏BF16支持的分上(这本来是Cooper Lake-SP存在的目的,但就是被腰斩了),大概也不会有太多大型云计算服务企业会大量导入训练工作。

只不过,“听说”英特尔第四代Xeon-SP“Sapphire Rapids”也是多芯片水饺,网络上也早已四处流传样品实物照,英特尔攻击AMD的招数,届时会不会变成回力镖打到自己脸上?更重要的是,这张规格表,特别是第三代顶配Xeon-SP比前代少了整整2,000美元降价幅度,与低很多的运行时脉,就足以说明很多“看不见的事实”了。

(首图来源:英特尔)