7倍AI性能提升，AMD Instinct MI100来了

云中子基础架构, 计算 2020年11月16日

1.89W 0 0

“在2016年Intersect 360市场调研报告中显示，有36%的用户对AMD处理器前瞻性有着非常好的印象。4年后的今天，这一比例提升至78%。超过两倍！”

2019年，AMD推出了代号为罗马（Rome）的第二代EPYC处理器，相比上代产品，无论是性能、核心数量、新技术支持还是安全性等方面都有了长足的进步，在云计算、虚拟化、高性能计算以及诸多行业应用方面，为用户带来了全新的选择。

与此同时，AMD也迎来了口碑与市场份额的双丰收，在企业级市场方面，AMD的增长速度更是惊人。

EPYC持续“进攻”高性能计算领域

近年来，高性能计算领域发展非常迅猛，工作负载也呈现出多元化的发展趋势，包括最新的模型训练、算法、推理、商用生命科学等等热门应用，都已经融入了高性能计算。

要知道在此之前，AMD第二代EPYC曾屡屡斩获HPC大单。包括：法国气象局BullSequana XH2000超级计算机、Cray推出基于Shasta架构的新型超算ARCHER2和Vulcan、苏黎世联邦理工学院超算、NEC为德国气象局提供的NEC SX-Aurora TSUBASA矢量引擎超算等等。

高校与科研方面则有：俄勒冈州立大学基因组研究和生物计算中心（CGRB）、劳伦斯·利弗莫尔国家实验室的Sierra超级计算机、德州理工大学、圣母大学、乌尔姆大学、荷兰国家亚原子物理研究所 (Nikhef)等等。

2020年4月，AMD又顺势推出了三大系列7Fx2高主频处理器，使其更加适合超融合、高性能计算、裸金属等应用。AMD发力超融合市场，有着自己的核心优势。计算力方面，超多的核心数量以及性能本身就表现出色，7Fx2系列更是将主频提升一个档次，进一步符合超融合的需求。

简单总结一下，2020年AMD EPYC依然稳扎稳打，在保持优势的同时发力生态建设，逐渐攻占不同应用领域，并且取得了巨大的成功。在性能、口碑、性价比以及市占率等方面都有了明显进步，整体表现非常抢眼。

Instinct MI100-面向数据中心的重磅炸弹

那么，时至年末，2020年AMD还有没有更大的“野心”呢？答案当然是肯定的！

AMD在GPU市场还有一颗重磅炸弹正在跃跃欲试，它就是Instinct MI100。

Instinct MI100在规格方面也是非常威猛，它是首款突破10TFlops FP64数据中心显卡，FP32计算能力是上代MI50的3倍。同时，当今最炙手可热的FP16 AI计算性能，比前代产品提升了7倍。

如果按照性能与单位成本核算的话，Instinct MI100的性价比则是竞争对手的两倍。

单纯谈到性能，大家可能感觉不出它有多强，下面我们举个例子。2000年，排名第一的全球超级计算机的性能是12.3TFlops，需要6兆瓦的功耗，总重达106吨。相比之下现在的AMD Instinct MI100单卡性能可以达到11.5TFlops，功耗300瓦，重量仅为1.16kg。

前后20年间，如此悬殊的对比，足见超级计算机发展速度之快。

细心的读者可能会发现，AMD的GPU卡在命名上也有了变化，不再像之前那样冠以Radeon的名字，这也意味着AMD会在品牌上区分两种不同的GPU，游戏卡继续沿用大家熟知的Radeon，计算卡直接用Instinct，前面不再加Radeon了，定位更加清晰。

作为重要的产品线，AMD主流GPU今后将会主攻两个方向：

第一是RDNA，主打3D显示和游戏性能，相信广大玩家们都非常熟悉了吧。AMD RDNA 2架构在全新AMD Infinity Cache高速缓存的助力下变得更为高效，能够以低功耗和低延迟提供卓越的带宽性能。整个显卡的所有核心均可读取高速缓存，有助于快速访问数据。也就是RDNA主要面向游戏、桌面及工作站等应用。

第二是CDNA架构，专注于计算性能，从而加速机器学习、高性能计算，而且通过Infinity Fabric技术灵活设计性能，并支持增强的企业级RAS特性、安全、虚拟化技术。CDNA依然以加速卡形式出现，主要应用在企业级数据中心领域。

AMD Instinct加速卡是专为数据中心而设计的GPU，产品包括前一代的Instinct MI50/MI60和刚刚我们谈到的Instinct MI100。CDNA架构是AMD全新GPU架构，将加速计算带入了万亿级计算时代，具有全新的Matrix Core Technology和AMD ROCm开放式生态系统，可提供更高水平的性能，通过Infinity Fabric技术，以扩展至更大的系统。从而可以和与Zen架构的霄龙高效协同，以扩展至更大的系统。

又一个AI性能巅峰

AMD Instinct MI100加速卡具有灵活的混合精度能力，搭载高性能计算单元，能够处理多种类型的工作负载，包括一系列的HPC和深度学习应用程序。全新的AMD Instinct MI100加速卡可以高效地处理工作流，比如快速训练复杂的神经网络，为数据中心和部门部署提供更高级别的浮点性能，功能和高效性。

在性能方面AMD也做出了对比，从上图我们可以看到AMD Instinct MI100相较MI50在高性能计算方面有大幅的性能提升，但其功耗并没有变化，依然保持300W。

FP32（Matrix）这项AI性能测试方面，与MI50相比更是有了三倍以上的性能提升，非常耀眼！

AMD Instinct MI100详细规格如上图，MI100计算卡拥有128组CU单元，8192个流处理器，搭配32GB HBM2显存，带宽1.23TB/s，基于PCIE Gen4总线。FP16（Matrix）精度性能达到了184.6TFlops，仅凭这一项就能秒杀很多HPC服务器了。

目前，也已经有很多服务器厂商跟进AMD Instinct MI100了。包括HPE著名的Apollo 6500 Gen10系列、戴尔PowerEdge R7525系列以及超微和Gigabyte的产品等等。它们最早将于本月正式发货。

AMD自家生态：ROCm开放式软件平台

此外，AMD此次特地强调了为加速计算打造的全新ROCm开放式生态系统，计算杂谈在今年早些时候腾讯云大会上曾经报道过。

该平台支持新加速器的架构特性，包括具有优化性的深度学习操作（DLOPS）和AMD Infinity Fabric技术。ROCm为规模化而设计，允许客户在开放式的环境中部署高性能、高能效的异构计算系统。

ROCm开放式软件平台针对Instinct MI100做了充分优化，从而实现了与上两代产品（MI25和MI50）对比，有了5到8倍的性能提升！

此外，还可以支持用户进行代码迁移，包括从HACC、SPECFEM3D、QUDA和Cholla迁移至ROCm平台，迁移时间从半天到近一个月不等。迁移后用户即可享受更加高效的EPYC+Instinct MI100的高性能组合了。

一直以来，AMD在产品方面都遵循两大原则，分别是打造领先的性能以及最高的性价比，从2020年市场表现及客户反馈来看，它毫无疑问地做到了。另外，在生态建设方面AMD也致力于与众多合作伙伴进行密切合作，硬件合作伙伴也从2017年的22个拓展至超过140个。

总体来看，刚刚问世的Instinct MI100是AMD在数据中心市场投放的一枚重磅炸弹，大有“黄沙百战穿金甲，不破楼兰终不还”之势，除了更高的性能及性价比之外还深入地融入到ROCm开放式软件平台中，使其有了更加广阔的应用场景，也为AMD进一步“霸占”高性能计算和数据中心市场做好了更具实战化的战略部署。

2020，是AMD里程碑式的一年！

本文由计算杂谈作者：云中子发表，转载请注明来源！

关键词：AMD

基础架构

7倍AI性能提升，AMD Instinct MI100来了

云中子

相关文章

VMware：数字化工作空间，持远虑，化近忧

戴尔科技集团借助全新服务和解决方案强化安全产品组合

构建开发生态“黑土地”，HDC.Cloud 2021即将开幕

热评文章

最赞的文章

发表评论取消回复