基础架构

让强大的机器服务于仰望天空的那群人

LensNews

从私塾到翰林院,由古至今教育行业都是整个社会中最受瞩目的领域。“教育”一词来源于孟子的“得天下英才而教育之”。拉丁语educare,是西方“教育”一词的来源,意思是“引出”。社会根据受教育程度选拔人才。人通过受教育实现社会地位的变迁。教育伴随着人类社会的产生而产生,随着社会的发展而发展,与人类社会共始终。

在现代社会中,教育行业的中流砥柱则可以称得上是“仰望天空”的那群人。高等院校的教育不仅仅是将已有的知识、技术授人予鱼,而且还会针对很多更具实战型的课题进行深入研究。整体来说就是包含了学习、知识验证、实验、探索以及拓展,因此各种先进的计算技术也是不可或缺。

笔者在2019年曾经采访过某国内一线大学的副校长,当时他们构建了一套计算能力非常可观的超级计算机。副校长对我们说:目前国内的高等教育行业发展速度迅猛,有相当一部分师资力量是来自于国外名校。对于名校的教师、教授而言薪金看得并不是那么重要,他们关注更多的是自己在相关领域的不断探索能否持续,一方面是学校的支持,另一方面则关注是否有强大的超级计算机能够辅助他们进行“科研”,从而保持在行业内的领先性。

物理学、化学、生物学、微纳材料与器件、金融数学与金融工程等等,都需要高性能计算机的强力支撑。由此可见,在科技飞速发展的现在,高性能计算已经成为教育行业不可或缺的重要组成部分。

目前,在高性能计算领域炙手可热的当属AMD了,当祭出第二代7nm工艺、Zen 2架构的Rome EPYC之后,彻底撕开了竞争对手近乎垄断的市场。一时间,从美国能源部、气象局到德国、英国超算中心都可以看到EPYC的身影,绝对性能、每核心成本、功耗比、新技术支持等等,这些方面都深深地吸引了用户,它不火谁火?

  

  最近,在全球高校的高性能计算机部署方面,AMD也斩获了很多,通过性能优势全方位助力仰望天空的那群人。

乌尔姆用EPYC打造高性价比云平台+HPC

       "我们天性中的一部分应感谢生我们的这座城市,因此,我怀着感激的心情想念乌尔姆,因为,艺术传统与简朴和健康的天性有关。"

  -爱因斯坦于1879年出生在乌尔姆

提到德国,第一印象就是各种高科技云集,汽车、机器人、软件、电器甚至厨具都能够风靡全球,而其众多的高校资源也是备受瞩目。

  

  最近,德国乌尔姆大学部署了基于AMD EPYC 7351P处理器的服务器,用以构建bwcloud云和高性能计算集群,帮助学生、教师和研究人员实现了高效率的教学与研发工作。

乌尔姆大学成立于1967年,是德国巴登-符腾堡州的一所研究型大学。这所大学有10000多名学生和60个学习项目。位于世界上最先进的能源研究中心之一的乌尔姆,该大学以其对电化学和相关学科的开创性研究而闻名。

基于AMD EPYC服务器的全新计算平台将有两大任务:第一是从硬件层面升级bwCloud云平台(Baden-Württemberg cloud),它为大学教师、学生和研究人员提供访问操作、项目、教学工作和数据挖掘等应用提供所需的计算能力。

并且广泛服务于巴登-符腾堡州的9所大学及德国所有26所应用科学大学的共享学术云,使其性能和规模都有了显著的提升。

该云平台还运行诸如MATLAB这样的教育软件,MATLAB是处理电化学建模的数值计算环境、数学编程语言和工作负载,特别关注未来的电池技术研究。

第二就是高性能计算集群建设,能够为学生和研究人员提供运行复杂量子化学和量子物理计算的能力以及机器学习。

bwCloud云平台负责人、乌尔姆大学IT服务通信主管Stephan Wesner博士表示:升级之前的bwCloud太小、太慢了,无法满足用户需求。大型应用程序所需的大量内存带宽正在降低性能,因为系统被迫依赖服务器外部的存储。一些科学应用程序需要大量内存支持才能得到更好的性能。

当系统升级至EPYC平台后,能够支持更多的内存通道与容量,因此可以将程序完全放入内存中执行,效率得到了大幅度提升。

同时,Wesner博士团队也详细核算了升级成本,最终选择了AMD EPYC单路服务器平台,其性能可以满足bwCloud的苛刻需求,并且有效降低每个节点的成本。最终bwCloud拥有112个节点和2.5petabytes的总存储容量,如今为数千人提供了可扩展的计算与虚拟机。

简单总结,与竞争对手相比,EPYC能够支持更大的内存带宽以及更高的内存容量,因此可以迅速提升bwCloud云平台性能,将一些应用程序完全放到内存中运行,效率远远超过访问磁盘。同时,单路EPYC更低的成本与功耗比也吸引了乌尔姆大学,为日后降低运营成本打下了坚实地基础。

最虐“芯”的应用,64核与基因测序

  “科学与和平是有联系的,世界已经被科学家的发明大大改变了,特别是最近一个世纪”

  -莱纳斯·鲍林,20世纪对化学科学影响最大的人之一,曾就读于俄勒冈州立大学

接下来,我们将视角转到美国,俄勒冈州立大学的海狸还在等着你。

  

  俄勒冈州立大学(Oregon State University,简称OSU)成立于1868年,是美国俄勒冈州的一所公立研究型大学,也是太平洋十校联盟中的一员。世界上唯一的一名同时获得诺贝尔化学奖和诺贝尔和平奖的科学家,被誉为“生物化学之父”的鲍林是该校校友。

雪豹、桉树、疫霉、玉米和大米都有什么共同点?基因测序将告诉你答案。俄勒冈州立大学的吉祥物北美海狸,也已经在基因组研究和生物计算中心(CGRB)进行基因组测序了!

众所周知,相比其他工作负载,基因测序、对比绝对称得上是重量级应用,其对计算、存储和网络要求极高,计算强度足以让任何超算都满负载运行。

CGRB服务于俄勒冈州的26个部门,研究人员可以访问该中心研发的4000~5000个程序。它们运行在支持5000多个处理器的分布式服务架构上,5 PB的存储空间,以及安全专用的1G/10G/40G网络。CGRB每天生成4TB到8TB的数据,大部分时间都会同时运行数千个作业。

CGRB生物计算部助理主任Chris Sullivan表示,每天都会有20000个工作任务需要执行,生成大量的文件,每个文件包含5000万个与基因组对齐的序列。每个文件使用不同的算法,可以同时运行。这项工作需要非常高的处理器核心和线程数,通过以往经验来看,需要非常高的成本预算来实现。

一直以来,Sullivan都在寻找能够超过100线程的处理器以供CGRB部署,但Power9等设备的成本非常高,大量部署的话预算堪忧。相比之下AMD EPYC处理器凭借128个线程数量,为超算中心立下了汗马功劳。通过增加多台基于AMD EPYC的强大机器,以获得更高的线程数和更低的总运营成本。

“我的一些小组在24核、48线程的至强服务器上运行程序出现了崩溃现象。现在,他们正在把其中的三个移到一个AMD EPYC 7601处理器上。”谈到实战,Sullivan这样认为。

AMD EPYC处理器的核心密度和线程数量也非常重要。因为CGRB计算中心由于空间与成本限制,已经不能再改造机房了。相反,EPYC处理器给了他新的选择。EPYC的双路服务器性能惊人,通过部分机器的更新就可以实现需要的计算线程数,从而快速的完成任务,再也不用考虑如何升级机房的难题了。

接下来敲黑板,总结一下,基因测序等相关研究对计算性能需求极高,较低线程服务器上甚至会出现崩溃现象,而64核128线程的AMD EPYC 7601则可以轻松搞定任务,由于计算密度更高,也就不需要海量的服务器堆叠到机房中,避免了机房改造。在高性能的同时,又有效降低了成本。

搞定“吃”内存的流体力学应用


        "生命,甘甜和希望"

  圣母大学校训,美国金融机构100强的总裁CEO中,本科毕业于圣母大学的人数占最多,雄踞全美各大学榜首。

圣母大学,是一所受天主教使命启发的私立研究和教学大学。该大学的研究计算中心(CRC)支持包括癌症、环境变化、全球健康等多个关键领域的多样化研究基础设施。

圣母院研究计算中心(CRC)支持大约2000个活跃用户帐户,支持200个不同的软件应用程序。为了支持他们的研究人员,CRC由50名工程师和开发人员组成的工作人员管理30000多个计算节点,在20个不同体系结构中有3~4PB的数据。

  

  WRF、Fluent、OpenFOAM、ANSYS和MATLAB是该HPC环境中关键的CRC应用程序和软件。CRC的关键是一个解决方案,其中包括HPE和AMD提供的HPC支持。

圣母院的CRC需要一个支持多种软件的平台,并满足其对流畅性、流体动力学和天气建模的高存储能力要求。他们所需的HPC环境将支持每个作业500个内核,并且能够扩展到更大的容量,每个内核需要2GB到3GB的内存。

需要核心能够直接和快速访问内存,基于AMD EPYC的HPE ProLiant DL385 Gen10具有高带宽和高速RAM的处理器能够满足需求。

“AMD和HPE系统给了我们更大的分析能力”,巴黎圣母院研究计算中心副主任Paul Brenner认为。“其中很多都是内存受限的应用程序,特别是流体力学,所以系统给了我们一个很好的架构,在这个架构上,我们拥有更大的内存和更高性能的计算能力。”

事实上,AMD EPYC处理器提供了从8到32核、64线程和8个内存通道,每个插槽最多2TB内存,对于用户来讲选择更加灵活。

简单总结,基于AMD EPYC处理器的HPE ProLiant DL385 Gen10服务器为CRC提供更高的内存容量、带宽和处理器核心,以经济高效地运行内存密集型工作负载。还使研究人员能够更快地收集和分析更大的数据集,帮助他们以显著加快的方式解决复杂的问题。

正如2019年发布时那样,新一代7nm制程的AMD EPYC(霄龙)系统级诞生在云时代,拥有更大的内存带宽和更强的I/O能力,并且在核心与线程数量方面全面碾压于竞争对手,为数据中心应用提供强劲性能。

在服务器厂商快速跟进的同时,教育和高性能计算领域也开始全面拥抱AMD EPYC,极高的性能、价格比可以让高校进一步控制系统成本,64核、128线程也为诸多重量级应用提供了强力计算支撑。

总之,它的成功绝非偶然!

(1)

本文由 计算杂谈 作者:云中子 发表,转载请注明来源!

关键词:, , ,
LensNews

热评文章

发表评论