AMD耕耘多年的技术反击力道

Xeon身为x86处理器主宰服务器市场的象征及英特尔20年来的“现金母牛”（Cash Cow），早已是科技业界众所皆知的常识，但你会相信英特尔的财报，会出现“服务器的净利低于个人计算机”那天吗？

这世上有些事情，即使发生了重大的改变，也不会很快就看到效应，尤其对于“动量”很大的服务器市场来说，更是如此。不过一旦发生，那影响就会持续很多年。以曾经靠着Opteron爽很久的AMD为例，在2008年开始就失去产品竞争力，但也死撑活撑到了2012年，停止了“正统”服务器产品线的发展，才算是被彻底逐出了市场，直到2017年的EPYC才重新反攻服务器的战场。

根据英特尔本季财报，2021年第一季营收197亿美元，比去年同期下降了1%，净利却相比去年同期57亿美元大幅下降了41%，仅仅34亿美元，主因在于“数据中心业务营收仅56亿美元，比去年同期减少20%”。更刺激的还在后面，数据中心业务的净利，在去年还有50%，今年却仅剩下23%，还远低于个人计算机的39%（去年43%）。

（Source：英特尔）

你眼睛绝对没有看错，你可以再看一次，笔者等你。

基本上除了“业力引爆”，笔者实在想不出更贴切的描述了。就笔者印象所及，英特尔新任首席执行官Pat Gelsinger在2005年底，从首席技术官转任数字企业业务群总经理时，面对的处境好像还没有这么惨烈，那时还是AMD吃下30% x86服务器市场市场占有率的全盛期。

但这背后却涉及大环境变迁，笔者就曾经亲眼见证过某云计算巨头的新建数据中心标案，把某颗牌价1,499美元的处理器，砍到599美元的惨案。笔者2017年夏天的《为何AMD近十年x86 CPU打不过Intel？战局会改观吗？》文中的“AMD抢滩的希望在云计算数据中心，而非传统套装服务器”这段，提到几个重点：

Google与云计算服务的崛起，大举重塑了传统服务器市场的生态：云计算服务企业为了降低运营成本，数据中心的硬件大多自行设计量身订做，再发包给系统代工企业，等于跳过传统服务器大厂与白牌服务器这关，采购处理器直接与供应商议价，借由一次性的巨量需求，大幅压低采购单价到外人难以像像的程度。

所以AMD一开始替EPYC设置开辟第二战场的抢滩登陆点，就是云计算数据中心，而非传统套装服务器市场，才更有机会冲高出货量和市场占有率，这从诸多产品规格特性，如8信道Unbuffered DIMM，弹性化的PCIe组态，无需插件系统芯片组就有一定水准的I/O界面可用，加装安全加密机制等，与核心设计上的取舍，像精简SIMD指令集运算单元，就可以看得一清二楚，一切为降低成本而生，你要32核心我就包4颗8核的水饺给你，甚至连芯片品质需不需要像以前那么可靠，都可能存在商量余地，至于能不能正面在所有应用场合战胜Skylake-SP，其实不见得那么重要。

讲的更白一点，EPYC表面上是一台2路服务器，但AMD实际上卖的，却是一台便宜的高密度8路系统。笔者只能说Intel花一堆工夫做那20几页演示文稿数落AMD EPYC的不是，完全在打空气，但即使Intel心里明白，不会更不能说出来。

如果AMD服务器市场占有率还是没有突破10%，甚至重回昔日30%高峰，那还真的会让投资人和AMD粉丝无语问苍天。

现在让我们回头瞧瞧这两家公司千呼万唤始出来的“新品”和英特尔对AMD发动的营销反击。

新冠肺炎搞得全球科技业出现史无前例大缺料、搞得一堆产品纷纷延期的高峰，3月15日，AMD“终于”发布Zen 3微架构第三代EPYC处理器（代号Milan），也理所当然的，AMD宣称最多64核心的EPYC 7003系列是“全球最好的数据中心芯片”。

至于性能经过完善调校后的Zen 3，IPC比Zen 2的多出19%这种连“光华牌工程师”和科技宅都该知道的基本常识，就不必浪费文本赘述了。就目前看来，假如谣传都是真的，补回AVX-512指令集和BF16浮点格式的AMD的Zen 4才值得受到真正的关注，因为届时EPYC才有真正全面挑战Xeon-SP的本钱。

4月7日，历经“Cooper Lake-SP之乱”与一再延误的10纳米制程，原本英特尔去年夏天HotChips 32开开心心发布的第三代Xeon-SP平台“Whitley”与Ice Lake-SP（ICX）处理器，被正式宣布推出，像超出预期的单芯片最多40核心（虽然还是输给AMD一大截）、Sunny Cove微架构提升20% IPC（这也是本来大家都清楚的事情）、比28核的前代多出46%的数据中心负载性能、提高74%的人工智能推理性能、平均性能比“五年前”Broadwell老系统增加2.65倍，以及“惯例性”的添加人工智能与密码学相关指令等，也都让人丝毫提不起劲。

但英特尔还是发动了久违的“演示文稿大作战”，也专挑AMD无法还手的项目，像Chiplet多芯片封装“水饺”难以避免的远程缓存访问等（但严格说来，第二代和第三代EPYC已比初代改善不少）。

AMD基于种种因素（提高生产效率、降低制程风险、减少NUMA Domain），将内存控制器移出处理器晶粒，难以避免的额外访问延迟，也变成英特尔攻击的重点。

添加指令集这档事就没啥好解释了，一翻两瞪眼，先抢先赢。

都用上AMD没有的AVX-512和一堆添加指令，性能不赢才奇怪。

以Google等云计算服务企业的逻辑来翻译英特尔的说法：云计算服务企业须最短的服务反应时间，让客户有机会接触更多的广告，所以应该选择他们家“Optimized for the cloud”的产品，除此之外，讲再多，都是多余。 “人工智能优化”？假若讲讲推论也就算了，光看在缺乏BF16支持的分上（这本来是Cooper Lake-SP存在的目的，但就是被腰斩了），大概也不会有太多大型云计算服务企业会大量导入训练工作。

只不过，“听说”英特尔第四代Xeon-SP“Sapphire Rapids”也是多芯片水饺，网络上也早已四处流传样品实物照，英特尔攻击AMD的招数，届时会不会变成回力镖打到自己脸上？更重要的是，这张规格表，特别是第三代顶配Xeon-SP比前代少了整整2,000美元降价幅度，与低很多的运行时脉，就足以说明很多“看不见的事实”了。

（首图来源：英特尔）