2024 年 9 月 27 日,俄亥俄州哥伦布市——俄亥俄超级计算机中心(OSC)将于 2025 年初在其 Ascend 集群上提供扩展的高性能计算(HPC)资源,此次合作对象为俄亥俄州立大学韦克斯纳医学中心和俄亥俄州立大学医学院。
俄亥俄超级计算机中心的 Ascend 集群新增的 GPU 将提供更强大的计算能力。
俄亥俄州立大学韦克斯纳医学中心已将一个研究计算集群的所有权转让给 OSC,这将使 Ascend 目前的配置为 OSC 的所有学术和商业客户提供的 HPC 能力提高六倍。
OSC 副主任道格拉斯·约翰逊(Douglas Johnson)表示:“OSC 与俄亥俄州立大学医学院关系密切,在过去十年中,我们为其教职员工的工作提供了专门的资源。当学院向 OSC 提出利用其硬件进行研究计算的机会时,我们知道必须想办法实现。增加如此大规模的资源将为俄亥俄州立大学和我们的其他客户群体带来巨大的好处。”
随着 Ascend 资源的增强,OSC 的所有客户,包括俄亥俄州立大学韦克斯纳医学中心和医学院的教职员工,将能够访问更强大的计算硬件,受益于更短的等待时间,并能在一个环境中简化其工作流程。改进后的集群将有助于培训下一代医学研究人员,并推动俄亥俄州的医学研究。
俄亥俄州立大学医学院院长卡罗尔·R·布拉德福德(Carol R. Bradford)表示:“俄亥俄州立大学医学院和 OSC 能够合作扩展我们的数据分析能力,这对生物医学界来说是一个胜利,也推进了我们转变医学教育、研究和患者护理的使命。”
俄亥俄州立大学医学院首席研究信息官蒂莫西·R·韦尔塔(Timothy R. Huerta)表示:“俄亥俄州立大学医学院与 OSC 的关系将现有 Ascend 集群的容量扩大了六到七倍,并且将硬件的日常管理交给了最有能力帮助我们有效利用投资的专业人员。这种方法对于管理我们的资源以支持我们共同的发现使命来说是最具成本效益的。”
Ascend 集群上新增的图形处理单元(GPU)也将有助于满足越来越多使用 HPC 集群进行人工智能和机器学习工作的 OSC 客户的需求。
约翰逊说:“OSC 最近的系统升级侧重于提供新的、先进的高性能计算资源,能够处理与人工智能、机器学习和数据分析研究相关的密集工作负载。我们看到了从医学和工程到社会科学和艺术等广泛学科的需求。”
下一代 Ascend 版本将是一个约 14 PetaFLOP 的系统,将新增 274 个戴尔节点,每个节点具有:
- 两个 AMD EPYC 7H12 2.60GHz,每个 64 核,每台服务器 128 核。
- 两个 NVIDIA Ampere A100,PCIe,250W,40GB GPU。
- HDR100 Infiniband。
位于克利夫兰的俄亥俄州集群拥有价值 800 万美元的硬件,与 2022 年底推出的当前 Ascend 集群兼容。OSC 投资超过 100 万美元将设备转移到位于哥伦布的俄亥俄州计算机中心的数据中心,并将其与 Ascend 集群集成。下一代系统预计将于 2025 年初全面上线。
OSC 在监督下一代 Ascend 项目的同时,还在完成其数据中心的另一项重大扩建——Cardinal 集群,该集群计划于 11 月初推出。Cardinal 是一个基于戴尔技术的集群,旨在支持俄亥俄州在研究、教育和产业创新方面对高性能计算资源不断增长的需求,特别是在人工智能领域。
在接下来的几个月里,随着 OSC 使这两个集群上线,它将与客户密切合作,帮助他们过渡到新的资源。Cardinal 将在今年秋天取代自 2016 年以来一直在运行的 Owens 集群。此外,增强的 Ascend 集群将允许 OSC 将自 2018 年以来一直在运行的 Pitzer 集群的一些用户迁移到更先进的资源。
OSC 的高性能计算客户服务经理布莱恩·吉尔福斯(Brian Guilfoos)表示:“在接下来的几个月里,我们将与社区分享更多细节,但 Owens 将逐步退役,以便有计划地将工作负载转移到新资源。新的 Ascend 将像我们现有的集群一样进行配置,这将使迁移更容易。OSC 将确定有特殊需求的客户,并帮助他们迁移项目和工作流程。”
除了与客户直接沟通外,OSC 还将在今年秋季举办一次关于其 HPC 集群发展的社区简报会。欲了解更多信息,请访问 www.osc.edu 。
OSC
俄亥俄超级计算机中心(OSC)通过提供强大的共享基础设施以及在先进建模、模拟和分析方面的成熟专业知识,满足了学术和工业研究社区不断增长的计算需求。OSC 为科学家提供了进行非凡发现和创新所必需的服务,与企业和行业合作,将计算科学作为全球知识经济中的竞争力量加以利用,并领导努力为劳动力配备 21 世纪工作所需的关键技术技能。

