现在是AMD进攻ARM服务器的好时机吗?

克劳塞维茨的“战争论”和薄富尔的“战略绪论”同为战略史上的不朽巨著,这两本书的共同特色,在于明确的指出“战略是一种特殊思想方法与演进的思考程序”,前者对此观念提出了完整的方法论,后者更进一步阐明“未来与准备”比“现在与执行”更加的重要。

ARM指令集K12微架构的AMD EPYC处理器,现在看来越看越像即将发生的现实,但好像又看似“做的到,但是不可能”的幻影。天底下所有的产品,背后都有其“技术”、“商业”和“政治”之间相互交织的逻辑,我们就通过回顾这一年多来发生的诸多好事,抽丝剥茧出AMD可能的打算。

2018年8月:Fujitsu在HotChips 30正式发布A64FX,也是史上首颗货真价实具备高端服务器等级性能与可靠性的ARM指令集兼容处理器,基本上就是将指令集从SPARC-v9转换成ARM- v8.2-A的SPARC64fx。

2020年6月:传出了AMD Ryzen C7的谣言与规格,看起来很像是进军手机市场的武器。同时以Fujitsu A64FX打造的富岳超级计算机,拿下Top500超级计算机第一名的宝座。

2020年7月:英特尔“大核配小核”的Alder Lake处理器,因为Gracemont小核并未支持AVX-512指令集,为了维持软件兼容性,必须封印Golden Cove大核AVX -512功能。英特尔的举动,进一步恶化x86指令集的版本碎片化(更扯的是,还是英特尔自家内部乱起来),然后Linux之父Linus Torvalds就为此开炮了:他希望AVX-512痛苦的死去(AVX- 512 Dies A Painful Death)。

2020年8月:有人注意到AMD有一份在当年6月30日生效的“大核配小核”专利,但是笔者特别撰文指出一个问题:AMD的新一代小核到底在哪里?

2020年9月:ARM发布Neoverse V1和N2平台,“认真的”踏出迈向数据中心的第一步。

2020年10月:VMware发布了ARM版ESXi Hypervisor,那时Pat Gelsinger还是VMware首席执行官。这件事背后有着极为深远的意义,只可惜没有得到来自众多科技媒体的关爱眼神。

2020年12月:苹果M1让一票果粉集体失去理智的当下,再度传出AMD重启K12处理器的研发计划。

2021年3月:AMD总算发布“全球最好的数据中心芯片”第三代EPYC(Zen 3微架构)。基本上,像Google、亚马逊、微软、Facebook等云计算巨头,统统都买单了。

2021年4月:NVIDIA发布预定2023年推出的Grace处理器和第三代DPU,其心脏将是下一代的ARM Neoverse。

这个月内,也上演英特尔财报出现“服务器毛利率低于个人计算机”世界奇观(这应该是1998年Xeon品牌诞生以来的首次),以及AMD靠着反攻数据中心的战果,交出营收年增93%的漂亮财报。这直接证明了一件事:20年来支撑Intel获利的“现金母牛”(Cash Cow)出现大麻烦了,时下处境比AMD的Opteron全盛期还糟糕。

接着,最近冒出了AMD的3纳米制程Zen 5微架构处理器,也将采用大小核心混合结构设计。

看到这里,相信各位看倌的脑海中,已经浮现若隐若现的鬼火。

AMD并非ARM处理器的新手,也是ARM自2000年以来,长期“骚扰”并企图结盟拓展服务器市场的对象,结果就是2016年那颗看起来规格有点搞笑(区区八核A57在当时是能干嘛?)、完全乏人问津的Opteron A1100。但假若现在出现的是“ARM核心数量(搞不好跟NVIDIA一样,直接使用现成的Neoverse核心)比x86版本更多的EPYC,而且还脚位完全兼容”,就完全让人笑不出来了。

不过这件事是否成真,还是充满了满满的问号,笔者就逐条自问自答,借由东施效颦那两位战略大师的“思考方式”,协助各位自行判断ARM架构的EPYC是否成真的几率。

为何一定要是EPYC,难道不能是RyzenPC机和笔记本吗?

原因很简单:AMD一定优先考虑高获利的数据中心市场,况且Windows On ARM的生态系统统也尚未成熟,没必要浪费资源自己打自己。

手机?连想都不用想。

难道ARM服务器的生态系统统就比较成熟吗?

当然不是,但对于云计算巨头来说,这对他们根本不是问题,这也是“如果此事能够成为现实,那一定是来自某个、甚至某票云计算巨头的强烈需求”的理论基础。

假设真的有ARM版本的EPYC,那核心会是自己的K12还是直接从ARM授权Neoverse?

这就要看那位有办法让AMD开案客户的需求了。

“理论上”我们都知道“在相同的研发能力、制程技术、产品诉求”的前提下,越简洁、越标准化的指令集架构,越能让厂商用更短的时间,开发出性能更好的产品(这刚好就是x86最大的弱点),不提AWS Graviton、Ampere Altra和Fujitsu A64FX,这些年来苹果已用实际行动告诉我们。

但无论指令集再怎么“干净”,研制高性能、尤其是足以挑战现行x86产品的处理器微架构,仍是劳师动众旷日耗时的辛苦工作。假如AMD真的把头洗下去,除了眼前出现了难以拒绝的诱因,趁机提前“替未来可能出现的巨变做好准备”,也是另一种可能性。

但看来AMD真的要研发新的x86小核,那这样他们还有足够的余力开发ARM版本EPYC吗?

这也是笔者对ARM版本EPYC与K12最大的质疑点(就算沿用Neoverse也一样),更何况依照现在AMD的行事风格,摆明要从Zen 4开始争夺“兼容性最佳x86处理器产品线”的地位,那颗研发中的省电小核,绝对100%支持AVX-512,这也不是什么简单的挑战,我们也有充分的理由相信英特尔现在应该也正在烦恼这件事。

别忘了,AMD还有EHP这张王牌还没打出来。

最后,回到本文的标题:现在是AMD进攻ARM服务器的好时机吗?

坦白讲,这是笔者无法回答的大哉问,但看在英特尔终于得到充分了解技术(说他是技术狂也不为过)的首席执行官,也要恢复钟摆(Tick-Tock)开发节奏,对所有竞争对手发动恐怖的持续施压。除非AMD真心认为x86在未来终究会被ARM彻底取代,或着与NVIDIA“英雄所见略同”,就算机不可失,恐怕也不是AMD有那个余力去掌握的。再说,只要微软没有吃饱太闲自毁Wintel生态系统统,x86指令集兼容性依旧是AMD的最佳保护伞。

(首图来源:AMD)