AMD EPYC 9005系列领先架构大揭秘!首次采用三种不同工艺

时间:2024-10-15 19:00:09分类:CPU浏览:6

近日,AMD正式发布了第五代Turin EPYC 9005系列。在前四代的坚实基础上,在工艺架构、规格、性能等方面进行了三维升级,再次实现了“遥遥领先”。

发布会结束后,快科技采访了AMD服务器部门高管Ravi Kuppuswamy、Madhu Rangarajan等人,交流了更多有关EPYC 9005系列的深入细节。

AMD  EPYC  9005系列领先架构大揭秘!首次采用三种不同工艺

首先我们来说说EPYC 9005系列的工艺问题。

上一代EPYC 9004/8004系列均基于5/6nm工艺,即CCD计算模块为5nm,IOD输入输出模块为6nm。

这一代升级为采用3/4/6nm三种不同工艺。为什么IOD模块还是6nm(但内部进行了升级),CCD模块首次分为两种:Zen 5版本采用的是4nm,Zen 5c版本采用的是3nm。如此尊贵?原因其实很简单。更先进的工艺可以让Zen 5c CCD模块在有限的芯片面积内塞入更多模块、更多核心。Zen 5部分中的每个CCD内部仍然有8个核心,但CCD数量从上一代的12个增加到16个,可以从最多96核192线程增加到最多128核和256 个线程。

Zen 5c部分中的每个CCD内部仍然有16个核心,但CCD数量从8个增加到12个。上一代的最大128核心256线程变成了前所未有的最大192核心384线程,创下x86处理器新纪录

AMD  EPYC  9005系列领先架构大揭秘!首次采用三种不同工艺

其次是建筑方面。

上一代EPYC首次推出Zen 4和Zen 4c两个架构版本,并分为两条产品线:Genoa EPYC 9004系列和Bergamo 97x4系列,后者进一步扩展了Siena EPYC 8004系列。

在延续这一设计的同时,新一代EPYC也对产品体系进行了调整。

EPYC 9005系列已经演化出Zen 5和Zen 5c两个版本。就像上一代一样,它们不是传统的所谓“大小核”,但仍然具有完全相同的架构、IPC性能、ISA指令集、一级、二级和三级缓存总计。数量也一样,唯一的区别还是后者的核心更多,所以其每核心的三级缓存小一些。其实是无论Zen 5还是Zen 5c,整颗芯片的最大三级缓存总量是相同的,但由于Zen 5c的每个CCD内拥有两倍于Zen 5的核心数,因此分配到的三级缓存更少一些,每个核心最多32MB。这样做的好处是Zen 5c可以容纳更多的核心,支持更高密度的计算,并且和Zen 5共享系统平台,需要专门的适配和优化,才能大大提高降低客户成本,加速普及。

需要强调的是,如果跨CCD访问三级缓存,延迟会变得非常高,从而极大地影响性能。因此,如果你仔细观察EPYC 9005系列AMD没有做三级缓存的跨CCD全共享设计,每一个CCD内的核心只访问自己的三级缓存。,你会发现Zen 5和Zen 5c都包含在内,没有刻意的划分(甚至产品代号都是一样的“都灵”),与上一代不同分为不同的产品系列。

AMD发言人表示,前几代Genoa和Bergamo发布时间不同,但Zen 5、Zen 5c是同时发布的,基于统一的产品栈,所以它们就是在一起的。AMD还贴心地提供了详细的产品列表,展示了不同的SKU型号,可以看到不同的主频、不同的Cache、不同的功耗。

如果一定要区分的话很简单,8-72核心的都是Zen 5,144-192核心的都是Zen 5c,96/128核心的编号9x55的为Zen 5、编号9x45的为Zen 5c。AMD  EPYC  9005系列领先架构大揭秘!首次采用三种不同工艺

另外,IOD虽然工艺没变,但是内部做了升级,主要是提升了内存控制器、内存速度,以及IOD/CCD核心之间的沟通,可以理解为在I/O物理层与核心之间的互连性能会更好。不过,AMD 并没有在IOD 中集成专用的AI 加速器,因为AMD 发言人表示,这会增加芯片面积和功耗,同时也会吃掉内存带宽。如果需要AI加速,请使用更专业的加速器。只有GPU,比如AMD自己的Instinct MI系列,性能会更好。

AMD发言人表示,GPU拥有每美元的最佳AI性能,而CPU能实现每美元的最佳通用计算性能。AMD  EPYC  9005系列领先架构大揭秘!首次采用三种不同工艺