HPC存储-NVIDIA新一代Eos超级计算机和OVX SuperPOD使用DDN存储

发布时间:

2022-12-23 00:00

在2022年3月举行的GTC22春季大会上,NVIDIA宣布了正在建造运行速度超快的 AI 超级计算机 Eos。该系统采用DGX SuperPOD架构建造,配备新一代 H100 GPU,可提供 18 Exaflops 的 AI 计算性能以及275 Petaflops 双精度性能。Eos超级计算机主要用于NVIDIA内部在气候科学、数字生物学和 AI 方面的研究工作。

 

然而,关于NVIDIA会选择哪家的存储系统来匹配Eos 这样先进的AI 基础设施却一直是个谜。在2022年11月举行的DDN用户大会上,NVIDIA解决方案架构和工程副总裁Marc Hamilton终于揭晓了答案:Eos采用了DDN EXAScaler存储。在 Eos 和 DDN 存储上训练的结果提交了 MLPerf 基准测试并创下 AI 训练的全新纪录。

 

此外,Marc 在演讲中还展示了 NVIDIA 如何通过创建整个数据中心的数字孪生来设计下一代加速的AI系统,采用NVIDIA Omniverse 进行预测、规划和运行大规模AI超算。支持 Omniverse 平台的硬件设备是 OVX 系统,NVIDIA 内部已经搭建了几台基于 OVX 的 SuperPOD,它由大约400台服务器组成,每台服务器有8颗 A40 或 L40 GPU, 用于运行 NVIDIA 内部的 OVX 工作负载。Marc 透露这些OVX SuperPOD 也采用了 DDN 存储。

 

欢迎观看Marc Hamilton在SC22 DDN用户大会上的演讲视频。

 

更多SC22 DDN用户大会的精彩视频回放,请访问以下链接:

https://www.ddn.com/company/events/ddn-data-summit-2022-on-demand/

 

了解更多关于DDN EXAScaler存储:https://www.ddnstorage.com.cn/product_exa.htm

 

相关新闻