[HPC存储] NVIDIA工程师带您走近SELENE超级计算机 | 细数选择DDN存储的几个原因
发布时间:
2021-12-08 22:38
NVIDIA公司构建的SELENE超级计算机是目前性能名列前茅的商用AI系统,它在 2021年11月的TOP500超级计算机排行榜上名列第6位。
SELENE是采用DGX 系统作为构建模块的DGX SuperPOD解决方案,它由560台DGX 系统(共 4480块 GPU),InfiniBand网络和DDN存储组成。是什么让这个AI基础设施如此特别?在以下视频中,NVIDIA数据中心高级系统工程师Prethvi Kashinkunti先生讲述了与DDN紧密合作有哪些感受,以及为什么选择DDN来建造这台AI超级计算机。
“NVIDIA SELENE支持我们团队开展先进的工作,如开发AI软件、自动驾驶汽车、HPC研究、高级图形、远程协作等,这需要高性能存储来匹配SELENE的计算能力。” Kashinkunti说:“DDN的存储满足NVIDIA AI超级计算机的技术要求,并且DDN团队提供优质的企业级技术支持和协作。”
除了大规模的语言模型建模之外,SELENE的计算能力也被NVIDIA团队用于其他工作,包括自动驾驶汽车、下一代图形渲染、量子化学和基因组学的工具。观看这段视频,了解支持AI应用的存储可以完成哪些任务!
英伟达的高级数据中心系统工程师 Prethvi Kashinkunti 表示他们为SELENE 超算选用DDN存储技术有以下几个原因:
★ “首先是AI 400X平台与InfiniBand 网络技术的集成,InfiniBand 网络在 SELENE 中被广泛使用,因此,如果一个解决方案能无缝集成到该通讯网络并无需额外更改,对我们来说是很大的受益。”
★ “第二个原因是DDN可以持续提供我们的应用程序所需的性能水平,在设计 SELENE 时,我们设定目标是从存储获取数据的速率达1TB/s,使用AI 400X平台让我们轻松达到这一性能水平,并在实际应用中实现这一性能。能够提供适当读写带宽的存储技术,对于我们保持很高的效率至关重要,我们认为DDN存储技术很适合这类应用。”
★ “我们选择DDN存储的第三个原因是关键的软件部分,DDN Exascaler 软件基于 Lustre 存储技术,Lustre是HPC中心常用的提供并行文件系统和高带宽存储的技术。”
相关新闻
暂无数据