2020-10-16 11:36:11
来 源
HPCwire
超算行业
EuroHPC联合项目(JU)是欧洲协同的超级计算平台,目前由32个成员国和数十亿欧元的资金组成。

EuroHPC联合项目(JU)是欧洲协同的超级计算平台,目前由32个成员国和数十亿欧元的资金组成。2019年6月,欧洲HPC在整个欧盟选择了8个超级计算中心作为欧洲HPC首批8个系统的主机。

15日,Nvidia宣布它将为这八个系统中的至少四个提供动力:Leonardo,由意大利CINECA托管;由卢森堡的LuxConnect托管的Meluxina;EURO IT4I,由捷克共和国IT4Innovations国家超级计算中心主办;和Vega,由IZUM在斯洛文尼亚托管。所有这四个系统将利用Nvidia Ampere GPU和Nvidia HDR InfiniBand网络,Atos将作为EURO IT4I(由HPE制造)以外的所有设备的主要承包商。

Nvidia和EuroHPC合作四台超级计算机,包括大型系统“莱昂纳多”

预计Meluxina会提供10个峰值petaflops。EURO IT4I,15.2;Vega 6.8 –所有非常受尊敬的目标都应该从Top500列表中获得认可。然而,CINECA的莱昂纳多系统堪称绝妙之举:一个计算巨头将为200个峰值petaflops提供服务,成本高达2.4亿欧元(EuroHPC的一半,意大利大学和研究部的一半)。莱昂纳多(Leonardo)是EuroHPC JU宣布的三套计划中的百亿美元级系统之一。

Nvidia和EuroHPC合作四台超级计算机,包括大型系统“莱昂纳多”

图片由Nvidia提供

规格和选址

莱昂纳多将拥有分布在约3500个Atos Sequana节点之间的约14000个Nvidia A100 GPU,每个节点配备有四个A100和在英伟达HGX底板上插槽的单个英特尔CPU。水冷节点将使用Nvidia Mellanox HDR 200Gb / s InfiniBand网络,CINECA表示,智能网络内计算加速功能可实现低延迟和高数据吞吐量,从而推动了这一网络的发展。对于Nvidia,此加速可将还原操作的速度提高7倍,将MPI性能提高2倍,并将远程GPU之间的数据移动速度提高10倍。(除明显的规模差异外,其他Atos内置系统预计将使用非常相似的配置;同时,HPE内置系统将基于HPE的Apollo 6500配置。)

CINECA是欧洲领先的超级计算组织之一,它将把Leonardo托管在正在博洛尼亚科学园内建造的新的节能数据中心中。视数据中心的及时建设而定,莱昂纳多计划于2021年开始部署,并于2022年某个时候全面投入运营。一旦启用,CINECA将利用莱昂纳多开展各种各样的研究活动。

莱昂纳多会做什么?

Nvidia解决方案架构和工程副总裁Marc Hamilton表示:“像其他任何国家级超级计算机一样,[莱昂纳多]真的会被用于广泛的研究。” CINECA则着重指出了在药物发现,太空探索,天气建模,材料科学和气候模拟中的可能用途。确实,几天前,欧盟委员会宣布,三台Exascale EuroHPC超级计算机之一将托管其登月计划的“ Destination Earth”项目,该项目旨在创建一个大型的基于云的仿真平台,以表示地球相互连接的生态和环境。社会系统。

CINECA HPC部门主管Sanzio Bassini说:“ CINECA在加速HPC应用程序开发的研究和工业界的发展中起着至关重要的作用。” “ Leonardo超级计算机是我们长期致力于突破现代百亿级超级计算机的极限的结果。”

莱昂纳多还将看到CINI的使用,CINI是意大利各地以人工智能为重点的大学联盟,目前是CINECA顶级系统(21.6 Linpack petaflops Marconi-100的最大用户之一,在最近的Top500列表中排名第9)。CINECA预计,一旦安装了Leonardo,目前在Marconi-100上进行的大部分研究几乎都会立即进行,因为新系统将运行与之前版本相同的CUDA软件堆栈。莱昂纳多几乎肯定会在另一个关键领域继续CINECA的研究-世界上几乎所有研究超级计算机都在解决这一问题。

汉密尔顿说:“在当今时代,必须提到超级计算机在COVID-19上的工作。” “当前的CINECA Top500系统与世界上许多其他系统一样,正在用于COVID-19研究。有趣的是,CINECA一直在进行(当然)学术研究,但它们也与……一些意大利制药公司紧密合作,致力于治疗COVID-19的药物,用于COVID-19的疫苗以及其他研究。” (有关CINECA与冠状病毒的斗争的更多信息。)

(AI)宝座游戏

英伟达(Nvidia)预计莱昂纳多(Leonardo)将提供10 exaflops的半精度AI性能(启用A100的结构稀疏性功能),所有相关人员都渴望将新系统冠以世界上最快的AI超级计算机的称号。虽然HPL-AI和MLPerf基准测试的结果需要等待实际系统的使用,但Nvidia表示对Leonardo的表现充满信心,并强调现代超级计算中强大AI性能的必要性。

Nvidia副总裁兼加速计算总经理伊恩·巴克(Ian Buck)表示:“从历史上看,超级计算机是根据其执行仿真的能力来衡量的。” “但是随着AI的出现,我们现在有了衡量超级计算机的新指标。…结果,随着AI的引入,超级计算机的计算能力呈指数级增长,从而使我们的超级计算机性能飞速增长。今天的现代超级计算机是AI超级计算机-它们必须成为科学的基本工具。”

汉密尔顿说,就Top500名单而言,如果莱昂纳多今天开始运作,它将成为欧洲最快的系统。他仍然警告说,估计未来的排名是“更多的是艺术而不是科学”,并且“我们必须拭目以待”莱昂纳多开始运作时的落脚点。

展望未来

八个已公布的EuroHPC系统的后半部分包括由保加利亚的索非亚技术园托管的4 petaflops PetaSC系统。由芬兰CSC托管的200 petaflops LUMI系统;由葡萄牙的Minho Advanced Computing Center托管的10 petaflops Deucalion系统;以及由西班牙巴塞罗那超级计算中心托管的200 petaflops的MareNostrum 5系统。这些系统仍在采购中,厂商可能会在今年年底前宣布。

总体而言,Nvidia硬件继续进入Top500榜单,其中333个使用Nvidia GPU和/或Nvidia InfiniBand网络的Top500系统。在这种普遍存在的挑战中,例如AMD的整体复兴和百亿美元级计划中的突出地位,Fugaku的排行榜榜首,无Nvidia的性能或英特尔即将推出的用于万亿级Aurora系统的GPU,英伟达正迅速采取行动以维持和扩大其有利地位。在英伟达计划以400亿美元收购Arm的过程中,这一点也许最为明显。

如果获得批准,对Arm的收购将为Nvidia提供欧洲联盟百亿亿美元计划的关键IP 。它还将在Nvidia和SiPearl之间建立正式关系,后者是在欧洲处理器倡议(EPI)的主持下为欧洲超级计算生产基于Arm的微处理器的公司。在收购Arm和获得这些新的EuroHPC胜利之间,信息很明确:Nvidia在欧洲超级计算领域的立足点不会很快发生。

声明: 此文观点不代表本站立场;转载须要保留原文链接;版权疑问请联系我们。