人工智能存储-insideHPC采访| AI商业应用增长带来的变化

发布时间:

2022-12-09 00:00

在美国达拉斯举行的SC22大会期间, 行业媒体insideHPC的主编Doug Black 采访了DDN公司市场高级副总裁Kurt Kuckein。他们谈到了DDN 近期的专注点和一些业务变化,以及DDN所观察到的市场和客户行为趋势。下面为您带来本次访问的摘要(D 代表Doug Black,K代表Kurt Kuckein)。

 

D:请您讲一讲DDN在SC22会议期间着重突出的地方

K:DDN面向的市场与AI相关,与GPU和其他加速器相关。我们的并行文件系统很适合这个市场,它能够很好地为那些工作负载提供服务。并行文件系统已被广泛的采用,尤其是用于可扩展的高端系统中。除此之外,我们也看到越来越多的商业客户正在部署单个系统或较小的集群系统。商业客户往往关注如何更好地利用存储IO性能,以及管理数据的爆炸式增长。

 

D:您是否看到持续增长的GPU使用?

K:确实,客户对GPU的兴趣一点也没有减少,尤其是将GPU用于更具扩展性的系统上。我们发现越来越多的客户要么找到我们,要么自己部署。我们还发现许多人对商业与教育合作感兴趣。许多高校的客户有部署复杂系统的经验, 他们与商业客户合作:托管商业客户的系统,或为商业客户提供管理服务,这是一种很有意思的趋势。

 

D:你们是否发现采用其他加速器来补充GPU的情况?

K:确实,我想市场一直对多样化的选择感兴趣。NVIDIA真的做得很好,它首先占领了很大的市场份额,推出了很棒的产品。我们也发现有的客户已经拥有CPU集群,因此会把NVIDIA的系统与原来的CPU系统相结合。

我们认为存储实际上是一个统一平台,它能够支持采用各种不同的技术。因此我们和许多不同的厂商合作,提供工作负载所需要的服务。比如,我们与Cerebras公司,Intel Habana以及其他提供类似AI技术的厂商都有合作。我们与这些公司共同编写参考架构,为客户提供一些经过验证的配置,教会客户如何配置来让计算和存储协同工作。

 

D:能否谈谈收回云端数据的强劲需求?

K:过去五年来的说法一直是每个人都在尝试上云,我并不认为这种情况会发生显著的变化。对于某些较小的工作负载,或某些业务导向(让业务保持正常运转)的工作负载类型来说,尝试上云是正常的。但是,对于AI数据,特别是我们称之为大AI数据,可能上云并不是那么适合。例如,那些车企尝试开发自动驾驶技术时,他们需要每天摄取TB级的数据,有时摄取PB级的数据。他们还要保存PB级的数据以便能回溯、训练和升级。我也看到类似情况发生在生命科学领域,那些客户有海量的影像,或者从系统中下载的实时信息并且想要快速地处理那些信息。

对于那些在云端做实时处理的客户来说,我们发现一个害处:一旦他们开始大量使用云端数据,他们就会发现成本飞涨。另外,还存在固有的延迟问题,以及纯粹的数据移动问题。那么,为什么不把性能导向的数据保存在本地呢?同时可以把一些更冷的数据传输到其他地方。

 

D:DDN是否更多地强调可用性和更多的服务?

K:我想那是与云相关的方案中的一部分, 它能够帮助一些客户。对于已经使用云的客户,无论他们是否把数据从云端收回来,他们已经涉足了服务的方式,即按需获得资源。对于那些找到我们的客户,很可能是因为他们不太熟悉并行文件系统,并且他们的AI数据管理存在固有的复杂性。我们希望能够让他们转到一种服务导向的架构,我们能够很快地提供客户需要的性能和数据管理,让他们专注于为自己的客户提供优质服务。比如,对于希望采用AI技术和并行文件系统的商业客户来说,我们还可提供全托管的服务。

 

D:EXAScaler已增加了许多性能改进,现在更注重可用性吗?

K:确实是这样。Lustre文件系统是EXAScaler的底层技术,它始终专注于峰值性能。我们为EXAScaler所做的改进并没有忘记那些性能路线, 我们一直致力于提高小文件性能和元数据性能,这些性能仍然是极其重要的。不过,创建可用的系统并使其广泛用于更加多样化的IT组织也是我们正在做的基本工作之一。

 

更多详情,欢迎观看DDN市场副总裁Kurt Kuckein 在SC22接受insideHPC采访的视频。

 

了解更多关于DDN存储:https://www.ddnstorage.com.cn/product_gs.html

 

【往期推荐】

 

相关新闻

暂无数据

暂无数据