基础架构

2019,处理器市场的多核之争

LensNews

11月18日,由国际超级计算大会(ISC)公布的新一期全球超级计算机500强榜单出炉。前几名基本没有太大变化,而值得关注的是,AMD EPYC霄龙处理器首次上榜,这也是AMD平台时隔多年首次重返顶级超算行列。

独家64核,囊括上百项世界纪录

知人者智,自知者明;胜人者力,自胜者强

——《道德经》,李耳,春秋

刚刚发布没几个月就登榜TOP500,要知道超级计算机的建设周期可要比服务器长很多,看来Atos Bull Sequana XH2000也是规划已久,由此也足见64核心Rome的吸引力有多强!

究其主要原因就是:独家64核!性能强劲,并且竞争对手没有。

正如《道德经》所言,AMD既熟悉竞争对手的产品,也更了解自己的实力,在潜心突破之后,凤凰涅槃般战胜之前的自己同时也破局竞争对手!

当2019年AMD祭出64核EPYC之后,便已全面步入了领导者阵营。

AMD EPYC 7002系列处理器基于x86架构,将多核心数、大内存容量、高内存带宽和海量I/O以适当比例组合起来,以实现高性能计算工作负载性能。

如果说第一代EPYC的意义昭示着AMD重返企业级市场,那么第二代Rome核心AMD EPYC处理器则奠定了AMD在计算领域的创新领导地位。

AMD EPYC(霄龙)采用了先进的7nm制程工艺,配备8到64颗物理核心,包括128个PCIe Gen 4通道和8个支持DDR4-3200的高速内存通道,并可访问高达4TB的高速内存。EPYC处理器的均衡资源集意味着可以更自由地根据工作负载调整服务器配置的大小。

以EPYC 7742为例,每个处理器具有64颗核心,基频为2.25GHz,加速频率高达3.4GHz。

Rome基于全新的Zen 2架构,并且采用革命性的模块化设计。在拥有计算核心Die的同时,还有专门的I/O Die,负责输入输出控制。

在测试中,第二代EPYC旗舰7742以及英特尔至强旗舰8280展示了在分子动力模拟学模拟方面的对比,结果显示前者具有1.6倍的性能提升。

突破边界,现如今Rome核心第二代EPYC已经打破了上百项世界记录的性能,其中包括:HPC、浮点计算、整体计算性能、Java性能、DB/ERP业务、能耗指标、大数据分析、云应用和虚拟化等等,为数据中心服务器定格了新的标杆。64核心乃是当前服务器处理器中的最多数量,相比之下英特尔最新发布的至强旗舰芯片最多也只有56核,从性能与核心数量上EPYC都实现了跨级别碾压。

安全方面,在AMD EPYC中内嵌了一个ARM架构小核心,它可以支持512位的密钥。也就是说,这一颗CPU可以支持500以上的虚拟机,每一个虚拟机机会有独立的密钥。当数据从CPU写进内存的时候进行加密。因此,如果黑客通过各种方式拿到内存中的数据,在短时间内也是难以破解的。为客户的资产及数据安全提供了完美保障。

实战流体力学,64核EPYC可扩展性强劲

千锤万凿出深山,烈火焚烧若等闲。

——《石灰吟》,于谦,明

英雄需有用武之地,强劲的处理器也是如此,就像《石灰吟》中所述,经过千万次锤打出深山,再经过熊熊烈火焚烧也视作平常事一样,只有这样的锤炼,才能造就精品。

那么,新一代64核EPYC在实战化的应用下会表现如何呢?接下来我们看一组测试。

ANSYS Fluent是一个通用的计算流体力学(CFD)和多物理场的工具,有助于在优化产品性能时考虑得更全面和及时。Fluen软件具备广泛的物理建模能力,可以为大量工业应用进行流动、湍流、传热和反应等类型的建模,具体应用包括飞机机翼上的气流、炉内燃烧、鼓泡塔反应器、石油平台、血液流动、半导体制造、洁净室设计、污水处理厂等。

该项测试主要考察处理器性能、可扩展性以及高负载下的表现,如果测试表现足够给力,那么则证明处理器在高性能计算及流体力学等场景下更具竞争力。

新一代AMD EPYC处理器的高内存带宽有助于确保最大限度地利用系统,优化执行时间和部署的总体利用率。许多高性能计算 (HPC) 工作负载要求平衡性能和每个核心的许可成本,以管理和控制总体成本,因此更高单核心性能尤为重要。

新一代AMD EPYC处理器在整个产品线中提供了一致的特性,允许用户在不牺牲特性、内存通道数量、内存容量或I/O通道数量的情况下优化工作负载所需的核心数量。无论每路的物理核心数量如何,都可以在所有EPYC处理器上访问8个内存通道,使得单核性能更加优秀。

AMD EPYC(霄龙)7002 系列处理器的可扩展性在ANSYS Fluent基准测试中表现优异。图中显示了AMD EPYC 7742在双路平台中的可扩展性,最多可扩展到16个节点。在每个处理器 64 个核心的情况下,每个节点具有128个物理核心,16个节点上共计2048个核心。

在Fluent基准测试套件最大的7个模型中,第二代AMD EPYC 7742在16个节点上显示了出色的可扩展性。最高的是emp_30M(1400万个单元),在16节点上的性能约为20倍。16个节点上所有7个基准测试的平均性能约为17.3倍。Open Racecar(2800万个单元)具有近乎完美的扩展性,在16个节点上的性能约为15.97倍。Fluent的超线性加速通常归因于大量“快速”内存(例如高速缓存或本地内存)的可用性及使用。将以上优异的单节点数量与以下的超线性可扩展性结果相结合,可以突显高效的集群性能。

在16节点AMD EPYC 7742集群上进行的横向扩展测试也显示了优异的结果。高效的扩展性表明AMD EPYC 7002系列处理器非常适合具有扩展需求的HPC应用。ANSYS Fluent能够在16个节点上有效地使用2048个核心,这一点同样非常惊艳。

多核心为用户有效降低成本

能用众力,则无敌于天下矣;能用众智,则无畏于圣人矣。

——孙武,春秋

64核的Rome EPYC堪称目前x86服务器芯片之魁首,凭借强大的性能表现,在多种工作负载下相较上代产品最高能将总体拥有成本 (TCO) 降低 50%。这一点对于互联网及云计算服务商来说,意义重大!

2019年,我们看到云计算市场依然纷繁热闹,针对学生人群,腾讯云推出了9.9元一个月的云服务器,“白菜”般的价格令人瞠目结舌。而在腾讯云的背后,则是AMD第二代EPYC的功劳,凭借更多的核心数量及更高的性能,让虚拟机成本大幅度下降,从而使云计算服务商能够以更低的价格吸引用户,为整个行业降低了云计算门槛,让更多学生能够第一时间接触到云服务器。

在此之前,Microsoft Azure就基于第一代AMD EPYC处理器系统上运行了Azure HB云实例,获得了此前难以实现的计算流体力学(CFD)性能水平。

现如今,Azure针对高性能计算的Azure HBv2虚拟机已经提供预览,进一步突破了云端高性能计算的边界。这些虚拟机全部基于AMD EPYC 7742处理器,为客户带来了超级计算机性能,支持200Gbps HDR InfiniBand和单项工作多达80000个核心,通过云就可以轻松、便捷地访问。

在高性能计算应用拓展方面,AMD近期也有所收获。据最新消息显示,Atos正在向法国气象局提供两台基于第二代EPYC的BullSequana XH2000超级计算机,用于大气、海洋和气候科学的动态天气预报和研究。

Cray宣布,推出两台配备第二代AMD EPYC处理器且基于Shasta超级计算机架构的新型超级计算机ARCHER2和Vulcan。

苏黎世联邦理工学院在其Euler VI系统中使用了AMD EPYC 7742处理器。

日本电气有限股份公司(NEC)目前正在提供德国天气预报服务,其使用的Deutscher Wetterdienst系统结合了第二代EPYC处理器和NEC SX-Aurora TSUBASA矢量引擎。

无论是云计算还是高性能计算,在“高精尖”领域,AMD第二代EPYC已经全面开花结果,生态合作伙伴也日益繁荣。

x86架构进化,一部没有终点的马拉松史

万人操弓,共射一招,招无不中

——《吕氏春秋》,吕不韦,战国

纵观x86处理器的发展史,从1971年,Intel推出了世界上第一款微处理器4004,它仅仅是一个包含了2300个晶体管的4位CPU,在现在看来还不如家用计算器。之后的很长一段时间里,CPU都在缓步前行。频率从几MHz到几十MHz,当工艺水平受到限制难以提升的时候,出现了外频与倍频。之后主频再创新高,Intel、AMD和Cyrix都在各自的赛道上奔驰着。

而当进入新世纪以后,CPU步入了高速发展的时代,在工艺的不断进步下,里程牌式的1GHz大关被突破。市场方面则变成了Intel与AMD两雄争霸,它们分别推出了Pentium4、Tualatin核心Pentium III和Celeron,Tunderbird核心Athlon、AthlonXP和Duron等处理器,竞争异常激烈。

当制作工艺再度成为拦路虎的时候,CPU主频难以提升,多核时代来临,成为新的救世主。而后的十几年里,多核处理器逐渐被发扬光大,各种应用软件也均予以支持,多核从繁荣走向了昌盛。

然而物理核心的堆叠数量毕竟会有尽头,在功耗与发热量的限制下处理器核心数量也受到了限制,达到一定程度后就再难提升。芯片制造工艺亦是如此,似乎被卡在14nm很久了。

而就在此时,AMD则顺势为之推出了拥有64颗物理核心的第二代EPYC,基于全新的7nm制程。破除了Intel在14nm踌躇不前的禁锢,并且在性能、核心数量等方面实现了全面超越,跻身领导者阵营。

半导体行业的发展并非一蹴而就,它是一条漫长的马拉松,在路上有人超越、有人落后也有人掉队甚至退出,能够始终坚持下来的终将距成功越来越近,但与马拉松的不同之处在于它可能一直没有尽头。若想燃起斗志,需与竞争对手相互超越才行,独角戏只会拖慢行业的发展。

在现阶段,我们惊喜地看到了产品端AMD新EPYC对Intel至强的超越,相信也能进一步激发两位老对手的潜能,以优秀的产品赢天下,诠释“万人操弓,共射一招,招无不中”,从而更加快速地推动行业前进。

(0)

本文由 计算杂谈 作者:云中子 发表,转载请注明来源!

LensNews

热评文章

发表评论