HPC存储-剑桥1号AI超算变革生命健康研究

发布时间:

2022-03-14 16:34

生命科学机构期望通过数字洞察来加快研究并更快地获得结果,数据就是他们的战略工具,人工智能(AI)和分析是取得成功的关键。然而,现有的IT和数据存储系统并非专门为AI和分析的超高速、大规模需求而设计。要在AI驱动的世界里取得成功需要一种新的高性能、以数据为中心的IT方法。

剑桥1号(Cambridge-1)是英国性能名列前茅的超级计算机,它帮助高水平的科学家和健康研究人员采用AI和仿真相结合的方法来加快数字生物革命,增强该国在生命科学行业的世界先进地位。剑桥1号由80台NVIDIA DGX 系统组成并配备超过2PB的DDN A³I 存储。剑桥1号也是NVIDIA首台对外部研究人员开放的超级计算机。

基于NVIDIA DGX SuperPOD™ 架构的剑桥1号被用于解决特别迫切的医学挑战并加快健康研究,包括医学成像、基因组学和新药发现。剑桥1号的创始合伙人(AstraZeneca, GlaxoSmithKline, Guy’s and St Thomas’ NHS Foundation Trust, King’s College London, 和 Oxford Nanopore)以及其他英国机构都希望这台超级计算机能致力于推动英国的健康研究,通过数字生物学更深入地理解疾病并带来医学突破。

在以下视频中,NVIDIA解决方案架构及工程副总裁Marc Hamilton先生介绍了剑桥1号的更多细节,适当的基础设施的重要性,以及为什么NVIDIA为剑桥1号选择DDN的AI存储。

 

新药发现的现代化手段

那些采用传统企业存储的机构,在试图把AI和分析程序用于生产环境时往往经历各种困难。传统存储系统在工作流中引入瓶颈并产生锁死,因而限制了性能,并且不能让大型多节点系统(如NVIDIA DGX SuperPOD)更大限度地利用大的数据集。当AI和高性能计算日益成为现代医疗和生命科学发现必备的工具时,不应该再把时间浪费在缓慢运行的应用程序,使用不足的GPU或难以管理的系统上了。为了成倍地加速AI和分析工作流,机构需要以经济划算的方式存储数据并快速地处理数据。

“设计世界上强大的AI系统时,有很多重要的考虑因素,存储是经常被忽略的一部分。”

Hamilton先生提醒我们,在AI部署中,存储经常是个被忽略的部分。AI部署其实对存储的性能、容量、并行数据移动、易用性提出了很高的需求,每一项对AI项目的成功都很重要。

NVIDIA选择DDN AI存储

DDN提供集中式、简单易用的存储系统,该系统能够管理整个AI数据生命周期, 让生命科学领军者能够以更快、更低成本的方式推进研究。

Hamilton先生解释道:"当研究人员有了某个想法并准备去实施时,存储必须可用。不能让他们在实施时还需要寻找备份的副本,担心存储的数据在不同设备间移动。配备DDN存储的DGX SuperPOD就实现了研究人员需要的功能和性能。SuperPOD是一个很简单的架构,借助GPU Direct Storage功能,我们能够通过网络从DDN AI400X存储直接将数据移动到GPU,即直接从InfiniBand接口移动到GPU的内存。这大大节省了时间,提高了整个系统的性能。"

"我会毫不迟疑地推荐DDN,我知道,如果DDN能满足DGX SuperPOD的需求,它就能满足我们其他客户的需求。"

DDN先进的智能存储和GPU技术相结合的解决方案经过实践证明可以消除复杂性和不确定性,从而满足了生产AI环境的需求。DDN匹配NVIDIA技术的参考架构让AI基础设施的选择、配置、购买和部署变得更简单,可以立刻提高AI应用的性能,同时消除管理复杂性和低下性能,从而避免这些问题拖延AI应用和研究。

"DDN是高性能环境中AI存储的代名词。"

Hamilton先生指出:"真正的差异点在于DDN使用了并行文件系统 — 这就是为什么DDN存储及EXAScaler文件系统成为DGX SuperPOD认证的存储产品,DDN提供的企业级服务和支持也与其他商业存储产品相同。"

这意味着客户的应用程序将快速运行,基础设施得到尽可能的利用,机构可以在实施阶段避免障碍和过多IT开销。 经过生产验证的参考架构让AI项目的开展更容易、更快, 因此AI服务可以在几周内, 而不是几个月或几年, 实现正常运营。

相关新闻