云计算和大数据

单核性能提升19%,AMD“米兰”又来刷纪录了

LensNews
企业级服务器市场,凭AMD引发的挑战而变得活力十足,市场发展由之前的挤牙膏变成了双雄争霸,EPYC霄龙的“人气值”也因此迅速飙升。

最近一段时间,有很多朋友向笔者发来疑问。

“AMD的第三代EPYC什么时候发布?”“工艺制程没变,性能提升不大吧?”“罗马核心已经是性能天花板了,新一代米兰表现会如何?”

同样地,笔者也觉得上一代“罗马”过于优秀,已经成为行业的天花板,那么这一代“米兰”呢?

根据以往经验来看,一般有两种情况:

1、性能小幅度提升,挤下牙膏,继续赚钱;

2、性能依然保持较大幅度提升,捅破天花板。

在其发布之前,笔者就有一种预感:作为向来勇往直前的挑战者AMD,应该会选择后者!

Zen3架构EPYC发布,带来新性能革命

果不其然,2021年3月15日,AMD正式发布了代号为“米兰”的第三代EPYC。心中的种种疑惑也被一一解开。第三代Zen3架构EPYC(霄龙)处理器,早已被行业人士期盼已久,它将为行业带来三大改变。第一、单核性能提升19%,整体性能依然会保持非常高的世界纪录,继续领先。第二、对于市场和行业用户而言,将带来更高的单位成本性能,这也是用户最为期待的重点。

第三、继续建设生态,通过更高的效率推动绿色节能

单核性能提升19%,AMD“米兰”又来刷纪录了

工艺制程与上一代“罗马”相同,能够沿用上一代主板,那么“米兰”是如何将IPC提升19%的呢?可以说“米兰”的设计非常巧妙,在上一代产品优良的基因之下,进一步优化了前端单元、载入/存储单元,以及执行引擎、缓存预取单元、微操缓存单元、分支预测单元。核心方面,与上代相比,“米兰”提供了两倍的L1、更大的分支预测器带宽、更快的预测错误恢复、更快的操作缓存拾取、更精细的操作缓存流水线切换。此外,还提供了独立的分支预测存储单元、更低的指令延迟、6宽度拾取与分发、更快的浮点FMAC等。在载入与存储方面提升比较大,载入带宽由Zen2的两个变为3个、存储带宽由1个变2个、更灵活的载入/存储指令、更好的内存检测等等。在内存通道支持方面,Zen3架构“米兰”显得更加灵活,能够支持4、6和8通道内存,满足用户的各种需求。

L3缓存优化,释放更强大的能量

有了如此系统性地优化,使得“米兰”在诸多企业级应用中再次刷新性能纪录。本文后面会讲到性能评测与对比,接下来谈谈CCX和共享L3缓存。

单核性能提升19%,AMD“米兰”又来刷纪录了

“小核心”的设计是AMD EPYC系列处理器的一大特征,它的灵活性很高,并且更容易将核心做多。CCX称为单元模块,一般被设计为8核、16线程,如果处理器是16核心,那么则需要两组CCX。

在上一代Zen2架构中,每个CCX中的CPU核心被分为两组,每组4个共用一组L3缓存,每个CCX中有两组16MB的L3缓存。

最新的Zen3架构则是将CCX中的8颗核心放在一起,共用32MB的L3缓存。所带来的优势在于缓存总量不变的情况下,每颗核心在大多数情况下都可以使用更多的L3缓存空间。

我们举个例子,8核心的Zen2“罗马”处理器,1~4核心为第一组CCX,5~8核心为第二组CCX,他们的缓存相互隔离,如果1核心想读5核心缓存的数据,只能通过IO间接调取,会明显增加延迟。

相比之下在Zen3“米兰”处理器中,8颗核心位于同一组CCX并共享32MB的L3缓存,任意一颗核心均可直接调取缓存数据,快速而直接。

据AMD方面介绍,正是由于“米兰”采用了这种设计,使得所有核心之间的交互更加便利,能够让需要占据较大缓存空间的应用性能提升明显。

在同样的固定频率、核心数量配置下,综合数十个应用负载测试结果,Zen3架构的IPC相比于Zen2提升了至少19%!

继续增强硬件级安全加密

此次,AMD还将AVX2扩展至256位,能够加速加密和解密算法。另外值得关注的就是SEV-ES了,在去年底,VMware让vSphere 7成为第一个由AMD EPYC处理器提供全面SEV-ES支持的虚拟机监视器。企业级用户非常关注安全和数据加密,而这一功能在AMD EPYC的支持下得以实现。更重要的是,客户可以充分利用SEV-ES的优势而无需再对其应用程序进行更改,从而简化了安全功能的实施。此次AMD再次增强了SEV-ES,能够限制中断和恶意程序的注入,还可以调试寄存器到交换状态中。传承了上一代的安全功能,此次AMD对密钥的生成和管理提供了加密功能,构建了以硬件级为基础的安全平台。在操作系统内核执行BIOS代码之前,先由安全处理器加载ROM,并对BIOS进行验证,同时执行秘钥管理,待验证通过之后再开始启动步骤。进一步降低安全风险。总的来看,就是从硬件到软件,都能够保障虚拟机、内存以及整个系统的安全,并且得到了VMware、AWS等企业级服务商认可。

性能,依然保持压倒性优势

谈了这么多改进与增强,Zen3架构“米兰”的实战表现到底如何呢?上一代EPYC表现太过抢眼,至今仍保持着数十项世界纪录,也同样将竞争对手远远甩下。因此AMD第三代EPYC挑战的并不完全是竞争对手Intel,也包括上代EPYC产品。我们先来看看HPC性能测试。参测产品为定位相同的Intel Xeon Gold 6258R,28核心56线程,主频2.7GHz,最高可睿频至4GHz,构建的双路系统。第二套平台:AMD第二代EPYC,Zen2的7H12,64核心128线程,主频2.6GHz,最大加速频率3.3GHz。第三套平台为:AMD第三代EPYC,Zen3的7763,64核心128线程,主频2.45GHz,最大加速频率3.5GHz。

单核性能提升19%,AMD“米兰”又来刷纪录了

高性能计算测试,重点考察于浮点运算能力,第三代EPYC的7763比竞争对手6258R性能高106%,呈现出压倒性优势。就在今年,美国能源部宣布的全球最快超级计算机Frontier将正式建成。它是由芯片厂商AMD和超级计算机制造商Cray为田纳西州橡树岭国家实验室建造。预计Frontier将有超过1.5 exaflops的处理能力,相当于排名靠后的160台最快超级计算机的算力总和。橡树岭国家实验室将安排Frontier用于一系列任务,重点是核能开发和气候研究等领域。

单核性能提升19%,AMD“米兰”又来刷纪录了

接下来是云计算相关应用性能测试,主要测试整数性能,测试对象不变,Zen3的7763依然保持着一倍以上的性能。在2020年,包括AWS、腾讯云都大量部署了基于AMD EPYC的服务器实例,在更低的成本下表现出了优异的性能,并且在安全性、能耗以及服务器占用空间等方面更具优势。

单核性能提升19%,AMD“米兰”又来刷纪录了

最后是企业级应用性能测试,此次选择了JAVA相关项目,测试对象换成了Intel Xeon Platinum 8280,这可是一颗上万美元的顶级产品哟!AMD EPYC方面则没有变化。相比之下Zen3的7763性能依然高出Xeon 8280一倍有余,也就是说EPYC依然可以“单路打双路”或“双路打四路”。也正是因为更高密度的计算能力,让EPYC在市场中受到了超融合、裸金属等厂商的青睐。第三代EPYC的问世,让AMD为企业级用户带来了每核心最高性价比的产品;最优化的总体拥有成本;通过与合作伙伴的密切合作,可以帮助客户更快地部署服务器,享受更高价值。AMD EPYC对于企业级用户而言,从第一代的观望,到第二代的积极部署,再到第三代上市之前的期待,它仅用几年的时间就在激烈竞争的市场中脱颖而出,与其强大的硬实力密不可分。

国际货币基金组织(IMF)预计,2021年世界经济实际GDP增速将达到5.5%,较2020年增长回升9个百分点,而中国经济将实现6%以上的增长。数字经济、在线办公等新经济呈现出蓬勃发展之势。5G、人工智能、生物技术、能源技术也将带来新的智能革命数据中心依然是支撑新经济、新革命的重要基础建设,发展势头迅猛。可谓“潮平两岸阔,风正一帆悬”。
2021也正是AMD EPYC最关键的一年,相信更多核心、更高IPC的“米兰”将为整个“数字革命”的发展写下浓重的一笔!

(1)

本文由 计算杂谈 作者:云中子 发表,转载请注明来源!

关键词:
LensNews

热评文章

发表评论