基础架构

7倍AI性能提升,AMD Instinct MI100来了

LensNews

“在2016年Intersect 360市场调研报告中显示,有36%的用户对AMD处理器前瞻性有着非常好的印象。4年后的今天,这一比例提升至78%。超过两倍!”

2019年,AMD推出了代号为罗马(Rome)的第二代EPYC处理器,相比上代产品,无论是性能、核心数量、新技术支持还是安全性等方面都有了长足的进步,在云计算、虚拟化、高性能计算以及诸多行业应用方面,为用户带来了全新的选择。

与此同时,AMD也迎来了口碑与市场份额的双丰收,在企业级市场方面,AMD的增长速度更是惊人。

EPYC持续“进攻”高性能计算领域

近年来,高性能计算领域发展非常迅猛,工作负载也呈现出多元化的发展趋势,包括最新的模型训练、算法、推理、商用生命科学等等热门应用,都已经融入了高性能计算。

7倍AI性能提升,AMD Instinct MI100来了

要知道在此之前,AMD第二代EPYC曾屡屡斩获HPC大单。包括:法国气象局BullSequana XH2000超级计算机、Cray推出基于Shasta架构的新型超算ARCHER2和Vulcan、苏黎世联邦理工学院超算、NEC为德国气象局提供的NEC SX-Aurora TSUBASA矢量引擎超算等等。

高校与科研方面则有:俄勒冈州立大学基因组研究和生物计算中心(CGRB)、劳伦斯·利弗莫尔国家实验室的Sierra超级计算机、德州理工大学、圣母大学、乌尔姆大学、荷兰国家亚原子物理研究所 (Nikhef)等等。

2020年4月,AMD又顺势推出了三大系列7Fx2高主频处理器,使其更加适合超融合、高性能计算、裸金属等应用。AMD发力超融合市场,有着自己的核心优势。计算力方面,超多的核心数量以及性能本身就表现出色,7Fx2系列更是将主频提升一个档次,进一步符合超融合的需求。

简单总结一下,2020年AMD EPYC依然稳扎稳打,在保持优势的同时发力生态建设,逐渐攻占不同应用领域,并且取得了巨大的成功。在性能、口碑、性价比以及市占率等方面都有了明显进步,整体表现非常抢眼。

Instinct MI100-面向数据中心的重磅炸弹

那么,时至年末,2020年AMD还有没有更大的“野心”呢?答案当然是肯定的!

AMD在GPU市场还有一颗重磅炸弹正在跃跃欲试,它就是Instinct MI100。

Instinct MI100在规格方面也是非常威猛,它是首款突破10TFlops FP64数据中心显卡,FP32计算能力是上代MI50的3倍。同时,当今最炙手可热的FP16 AI计算性能,比前代产品提升了7倍

如果按照性能与单位成本核算的话,Instinct MI100的性价比则是竞争对手的两倍。

单纯谈到性能,大家可能感觉不出它有多强,下面我们举个例子。2000年,排名第一的全球超级计算机的性能是12.3TFlops,需要6兆瓦的功耗,总重达106吨。相比之下现在的AMD Instinct MI100单卡性能可以达到11.5TFlops,功耗300瓦,重量仅为1.16kg。

前后20年间,如此悬殊的对比,足见超级计算机发展速度之快。

7倍AI性能提升,AMD Instinct MI100来了

细心的读者可能会发现,AMD的GPU卡在命名上也有了变化,不再像之前那样冠以Radeon的名字,这也意味着AMD会在品牌上区分两种不同的GPU,游戏卡继续沿用大家熟知的Radeon,计算卡直接用Instinct,前面不再加Radeon了,定位更加清晰。

作为重要的产品线,AMD主流GPU今后将会主攻两个方向:

第一是RDNA,主打3D显示和游戏性能,相信广大玩家们都非常熟悉了吧。AMD RDNA 2架构在全新AMD Infinity Cache高速缓存的助力下变得更为高效,能够以低功耗和低延迟提供卓越的带宽性能。整个显卡的所有核心均可读取高速缓存,有助于快速访问数据。也就是RDNA主要面向游戏、桌面及工作站等应用。

第二是CDNA架构,专注于计算性能,从而加速机器学习、高性能计算,而且通过Infinity Fabric技术灵活设计性能,并支持增强的企业级RAS特性、安全、虚拟化技术。CDNA依然以加速卡形式出现,主要应用在企业级数据中心领域。

7倍AI性能提升,AMD Instinct MI100来了

AMD Instinct加速卡是专为数据中心而设计的GPU,产品包括前一代的Instinct MI50/MI60和刚刚我们谈到的Instinct MI100。CDNA架构是AMD全新GPU架构,将加速计算带入了万亿级计算时代,具有全新的Matrix Core Technology和AMD ROCm开放式生态系统,可提供更高水平的性能,通过Infinity Fabric技术,以扩展至更大的系统。从而可以和与Zen架构的霄龙高效协同,以扩展至更大的系统。

又一个AI性能巅峰

AMD Instinct MI100加速卡具有灵活的混合精度能力,搭载高性能计算单元,能够处理多种类型的工作负载,包括一系列的HPC和深度学习应用程序。全新的AMD Instinct MI100加速卡可以高效地处理工作流,比如快速训练复杂的神经网络,为数据中心和部门部署提供更高级别的浮点性能,功能和高效性。

7倍AI性能提升,AMD Instinct MI100来了

在性能方面AMD也做出了对比,从上图我们可以看到AMD Instinct MI100相较MI50在高性能计算方面有大幅的性能提升,但其功耗并没有变化,依然保持300W

FP32(Matrix)这项AI性能测试方面,与MI50相比更是有了三倍以上的性能提升,非常耀眼!

7倍AI性能提升,AMD Instinct MI100来了

AMD Instinct MI100详细规格如上图,MI100计算卡拥有128组CU单元,8192个流处理器,搭配32GB HBM2显存,带宽1.23TB/s,基于PCIE Gen4总线。FP16(Matrix)精度性能达到了184.6TFlops,仅凭这一项就能秒杀很多HPC服务器了。

7倍AI性能提升,AMD Instinct MI100来了

目前,也已经有很多服务器厂商跟进AMD Instinct MI100了。包括HPE著名的Apollo 6500 Gen10系列、戴尔PowerEdge R7525系列以及超微和Gigabyte的产品等等。它们最早将于本月正式发货。

AMD自家生态:ROCm开放式软件平台

7倍AI性能提升,AMD Instinct MI100来了

此外,AMD此次特地强调了为加速计算打造的全新ROCm开放式生态系统,计算杂谈在今年早些时候腾讯云大会上曾经报道过。

该平台支持新加速器的架构特性,包括具有优化性的深度学习操作(DLOPS)和AMD Infinity Fabric技术。ROCm为规模化而设计,允许客户在开放式的环境中部署高性能、高能效的异构计算系统。

ROCm开放式软件平台针对Instinct MI100做了充分优化,从而实现了与上两代产品(MI25和MI50)对比,有了5到8倍的性能提升!

此外,还可以支持用户进行代码迁移,包括从HACC、SPECFEM3D、QUDA和Cholla迁移至ROCm平台,迁移时间从半天到近一个月不等。迁移后用户即可享受更加高效的EPYC+Instinct MI100的高性能组合了。

一直以来,AMD在产品方面都遵循两大原则,分别是打造领先的性能以及最高的性价比,从2020年市场表现及客户反馈来看,它毫无疑问地做到了。另外,在生态建设方面AMD也致力于与众多合作伙伴进行密切合作,硬件合作伙伴也从2017年的22个拓展至超过140个。

总体来看,刚刚问世的Instinct MI100是AMD在数据中心市场投放的一枚重磅炸弹,大有“黄沙百战穿金甲,不破楼兰终不还”之势,除了更高的性能及性价比之外还深入地融入到ROCm开放式软件平台中,使其有了更加广阔的应用场景,也为AMD进一步“霸占”高性能计算和数据中心市场做好了更具实战化的战略部署。

2020,是AMD里程碑式的一年!

(0)

本文由 计算杂谈 作者:云中子 发表,转载请注明来源!

关键词:
LensNews

热评文章

发表评论