2022-04-12 21:43:14
来 源
中存储
超算行业
新型高性能计算集群Ascend,配备先进的 NVIDIA 图形处理单元 (GPU),以支持人工智能 (AI)、机器学习、大数据和数据分析工作。

2022 年 4 月 11 日 — 美国俄亥俄超级计算机中心 (OSC) 宣布将推出一个基于戴尔技术的新型高性能计算集群Ascend,配备先进的 NVIDIA 图形处理单元 (GPU),以支持人工智能 (AI)、机器学习、大数据和数据分析工作。

俄亥俄超级计算机中心将推出一个基于戴尔技术的新型高性能计算集群Ascend

“在过去几年中,OSC 对其 GPU 资源的需求不断增长,”OSC 副总监 Doug Johnson 说。“通过建立一个专注于快速分析超大型数据集的集群,支持无法在我们当前系统上运行的各类 AI/ML 应用程序,以及需要最快 GPU 的模拟,OSC 将更好地满足这些客户的需求,同时确保及时处理对我们现有集群 Owens 和 Pitzer 的请求。”

奥升德将帮助满足越来越多参与人工智能和机器学习领域研究和技术创新的客户的需求。OSC 目前参与了两个由美国国家科学基金会资助的旨在推进人工智能工作的项目。一个是由俄亥俄州立大学领导的具有环境计算学习的智能网络基础设施人工智能研究所(ICICLE),该研究所将构建下一代网络基础设施,重点是让每个人都更容易使用人工智能。

OSC 今年还提供“面向网络基础设施 (CI) 专业人员的 AI 训练营”,以在全国范围内的 OSC 等研究计算设施的工作人员中培养 AI 和支持技术方面的专业知识。

“奥升德将为 ICICLE 研究团队提供最先进的资源,以探索和开发新的人工智能技术,同时也让我们的员工有机会增加他们对人工智能工作量和最佳实践的理解,以支持这个不断增长的领域,” OSC 软件应用研究主管 Karen Tomko 说。

Ascend 反映了俄亥俄州在俄亥俄州高等教育部和校长 Randy Gardner 的支持下的持续承诺,以确保俄亥俄州的学术和行业研究人员能够获得超级计算领域最前沿的技术。

该项目是 OSC 和几家信息技术供应商之间的合作。Dell Technologies 正在设计和构建新系统,而 AMD 提供 CPU,NVIDIA 提供 GPU 和 InfiniBand 网络。

Ascend 由配备 48 个 AMD EPYC(霄龙)CPU 和 96 个 NVIDIA A100 80GB Tensor Cores GPU 的戴尔 PowerEdge 服务器组成,由 NVIDIA NVLink 增压并通过 NVIDIA Quantum 200Gb/s InfiniBand 平台互连,将 OSC 的人工智能、建模和仿真能力提高了三倍。新系统加入了 OSC 的 Pitzer 和 Owens 集群目前 5.5 petaflops 的能力、超过 14.2 PB 的磁盘存储容量和超过 14 PB 的可扩展备份存储。Ascend 将增加额外的千万亿次性能。

“戴尔科技正在与俄亥俄超级计算机中心合作,帮助行业和学术研究人员利用最新的先进计算技术和专业知识在各自领域开创先河,”戴尔科技公司 PowerEdge、核心计算和高性能计算副总裁 Rajesh Pohani 说. “通过强大的 PowerEdge XE8545 服务器增强的奥升德 AI 功能将补充并显着扩展对工程创新和科学发现至关重要的先进计算资源,最终有助于推动人类进步。”

NVIDIA 超大规模和 HPC 副总裁 Ian Buck 表示:“百亿亿次人工智能时代将使研究人员能够做出几十年来被认为无法实现的发现。“NVIDIA 的加速计算平台为 OSC 的研究人员等先驱者提供了 Ascend 等下一代超级计算机的突破性性能,以突破科学探索的界限。”

“AMD EPYC(霄龙)处理器为世界各地的研究人员提供了回答一些重大科学问题所需的性能和生产力,”AMD 高性能计算总监 Brock Taylor 说。“我们很高兴 Ascend 超级计算机将帮助俄亥俄超级计算机中心推进他们的使命,以提高人工智能、机器学习、大数据和数据分析的水平。”

“每个节点有四个 A100 80GB NVLink GPU,Ascend 将为我们的客户提供独特的领先资源,”Johnson 说。OSC 的客户服务团队将评估客户在 Ascend 上运行项目的请求,这些项目可通过 OSC 的 OnDemand 门户网站访问。

OSC 计划在今年夏天公布 Ascend 发布和上市的更详细时间表。

声明: 此文观点不代表本站立场;转载须要保留原文链接;版权疑问请联系我们。