21

2021

-

11

精彩回顾| 拥抱人工智能技术 开启金融服务加速模式


  11月24日下午,由DDN 公司主办的《人工智能加速金融服务》研讨会在线举行。本次研讨会邀请了7位来自国内金融领域的学者和业界技术专家进行分享,其中4个报告侧重于金融服务领域典型的人工智能(AI)应用,另外3个报告侧重于支撑AI应用的IT架构以及GPU和存储技术。小编整理出其中部分精彩片段,以飨读者。

  

 

  复旦大学泛海国际金融学院学术副院长兼金融科技研究中心主任 张纯信教授

  根据金融科技研究中心过去几年做的金融科技领域调研报告总结出AI在金融行业应用的三大趋势:

  1. 精准营销(俗称获客):整合多方、另类数据(尤其是非结构数据)实现多维深度理解客户,精准面向新客户,并为现存客户开发和提供新服务。

  2. 智能客户管理:通过大数据与AI技术对用户需求进行深度分析,实现金融产品去同质化

  3. 风控升级:除了统计方法以外,采用知识图谱等多维数据连接技术来锁定真正的风险因子

 

 

  在张教授看来,虽然我国金融机构的科技化投入并不少,但是基本上投入在传统IT领域,对前沿新技术的投入较低。而且,国内金融机构布局金融科技的方式比较单一,几乎都集中在财富管理领域。正因为如此,张教授预计我国未来将呈现多元金融科技(包括大数据+IOT、 云、区块链、人工智能)同步发展的趋势,AI和金融行业结合具有极大的发展空间。

  DDN销售总监 杨志雷先生

  首先简单介绍了DDN公司的基本情况:作为专注于存储领域的公司,DDN的体量虽然比友商小,但却凭借独特的技术专长在高性能计算(HPC)和 AI 领域名列前茅,多年来在第三方市场研究机构及专业媒体的评估中频频获奖,这些奖项代表了整个行业对DDN极大的认可。DDN的产品不仅包括存储硬件设备,还包括商业版的Lustre并行文件系统,以及一系列智能管理和监控软件。自从2000年进入中国市场以来,DDN不断加强本地技术团队的建设,现在已具备设计、实施和服务的各方面本地技术能力,可以为客户提供原厂L1到L3的专业服务。

  DDN国内的众多用户中不仅有知名的高校和研究所,还有许多企业和商业机构,这其中就包括国内百亿级量化交易机构(限于保密协议不便具名)。

  当今的金融行业实际上已经进入了算力时代,无论是对交易数据的分析,还是风险控制管理和欺诈检测,数据量都在爆炸性地增长;另外,对实时计算的需求也在不断上升,这就对算力提出了更高要求,也对支撑计算性能的存储和网络提出了更大的考验。DDN已经与合作伙伴一起面向交易回测、风险管理和分析、支付实时流处理等应用场景在国内外落地了很多的项目。

 

 

  此外,杨志雷先生还着重分析了市场数据分析平台和风险管理平台中的架构,对比了传统平台与DDN解决方案的架构,因为架构的改变,DDN的解决方案不仅为客户带来了性能提高,还提高了管理性和投资收益。

  DDN存储解决方案架构师 李凡先生

  首先从架构角度出发对比了并行共享架构与分布式NAS架构,由于并行架构没有访问热点,所以能更大限度地发挥并行任务的效能。而采用并行共享架构的DDN EXAScaler商业版文件系统正是多方面优化、高带宽、低延迟、高并发、可扩展的高性能并行文件系统。不过,DDN交付给客户的不是一个文件系统,也不是一个DIY的硬件,而是集成了商业版文件系统的一体化存储产品。凭借多年的技术积累,DDN研发的产品具有不少独到之处,例如热节点(Hot Nodes), 支持 GPUDirect Storage (GDS), MultiRail等。

  

 

  在金融行业,DDN配合英伟达的GPU提供整体解决方案。DDN与英伟达的配合不是简单的硬件匹配,还包括了应用层面的配合。因此,使用高端的GPU匹配DDN高速并行存储来运行并行应用软件,可以让计算时间大大减少,提高生产效率。

  此外,李凡还分享了一段为某量化交易客户做测试的亲身经历。当时,该客户想对DDN的存储、本地的SSD存储、以及NAS存储进行性能比较。初期的测试发现DDN存储的性能比不上本地的SSD存储和NAS存储,经过DDN和用户技术团队的排查才发现问题出在客户的软件架构上,他们的软件使用的CPU都是单核和单进程的,因此无法发挥DDN并行存储的优势。在引入并行应用软件之后,该客户在多机多卡的环境下进行测试,结果显示DDN存储的性能远高于NAS存储;而且DDN作为一个网络存储也能提供跟本地SSD存储接近的性能,DDN作为共享存储,只需一份数据就能满足多台服务器同时访问,不需要在每台服务器的本地SSD存储上都拷贝一份数据。在性能接近的情况下,DDN存储能够基于NVMe做数据保护,还具备多机多卡共享的能力,这两个特点都是本地的SSD存储所没有的。

  英伟达金融领域高级解决方案架构师 赵凡博士

  作为加速计算的全球领军企业,英伟达在数据中心,高性能计算,以及人工智能超级计算方面都有相应的布局。除了GPU,DPU和未来即将发布的CPU这三类芯片以外,英伟达还拥有全堆栈的软件,涵盖开发工具、加速计算,网络等多个方面。赵凡博士首先介绍了英伟达的软硬件生态,尤其是软件工具和平台,并特别对数据处理系统RAPIDS做了比较详细的介绍。通过RAPIDS把整个数据处理流程转移到GPU上面去完成,不仅可以将CPU贡献出来去做其他的事情,而且数据处理的速度也有了大幅度的提高。

  谈到机器学习、深度学习在量化投研方面的应用, 赵博士分别介绍了量化投研的基本流程和常用算法,这些算法跑在GPU上比跑在CPU上实现了性能3~5倍的提高,甚至是数量级的提高。

 

 

  此外,赵博士还分享了NLP技术在股价的预测和市场情绪分析方面的应用,以及基于强化学习的量化交易应用。国内先进的量化交易企业幻方已是英伟达的用户,幻方自建的萤火虫超级计算机中已大量采用了GPU来开展经济金融行为分析和NLP相关的工作。

  北京智速科技有限公司CEO 王子田博士

  根据王子田博士的介绍,量化投资是指采用数学模型替代人的主观判断,并利用计算机技术来做自动化交易的一种交易方式。在国际上,采用量化投资的巨头已经占据了发达国家市场成交量的前列,这些国际巨头中既包括资产管理规模很大的公司,也包括做高频交易的公司。国内量化投资的发展要比国外晚一些,但近两年量化私募的发展速度却很快,资产管理规模较大的公司已经达到1000亿以上。从趋势上来看,量化管理的资产规模在国内市场也正在占据越来越大的比重。

  在王总看来,量化投资主要是与数据和计算机打交道。除了做数学模型之外,量化投资有很大一部分工作和计算有关,也就是与高性能计算和高性能存储有很密切的关系。例如,在同样的计算量的情况之下,在更短的时间内完成任务,这主要涉及高频交易、实时计算优化等场景。另一种情况是在单位时间内,让计算机完成更多的计算内容,这主要涉及大规模的回测(在大量数据上做历史数据的回测)、参数优化、大规模的机器学习(比如用深度学习或者强化学习和很大的算力的这些学习场景)。王总还从历史数据和实时数据两个层面分别举例说明。

  之后,王总还跟大家分享了智速科技公司在高性能计算方面所做的工作,包括期权的极速辅助定价服务,以及从海量的参数(万亿级)里寻找理想参数或者参数高原。

  世界500强某保险集团IT部门的付杰先生

  付杰先生也是保险IT圈自媒体公众号“落风潭”的主笔,他首先回顾了存储架构演进的历史(从早期的SAN发展到NAS和对象存储),以及不同架构存在的问题。对于用户如何做好存储选型,他还给出了自己总结的“三板斧”建议。

 

 

  付先生表示,企业用户过去认为只需购买一些现成的商用模型直接使用即可。但随着对AI认识的深入,企业还是需要自己做一些AI模型的自研,即在一个已有的模型之上结合自己的实际情况进一步迭代和改进。这些工作需要数据支撑去计算,尤其需要处理大量非结构化数据,这时候企业内部就会出现对训练的需求。AI训练需求的背后就是对整个IT架构的要求。付先生强调一定要有架构优先的思维方式,先把架构设计好才能做好新技术向应用赋能。目前,AI训练中的计算大都放到GPU上去做了。除了考虑计算部分之外,还要规划好存储和网络。传统的存储架构并不是专门为数据密集型的AI训练而设计的,如何为多台服务器多块GPU快速地提供大量的数据,让GPU不空闲、不等待,那么并行共享存储架构就起着至关重要的作用。

  上海雅捷信息技术公司GPU数据库产品总监 许盼兮先生

  许先生从数据库的角度提供了一个新的大数据的存储解决思路并分享了上海雅捷自研的分布式GPU数据库DataTurbines的优势和特点,包括支持关系型数据库SQL,性能方面超越现有的内存数据库,支持虚拟化部署,服务高可靠性,支持第三方算法库如NVIDIA的RAPIDS和NCCL库,可与深度学习应用集成,和Hadoop有比较好的底层融合,已经支持Hadoop下大部分的文件格式和数据导入导出的处理。

  根据许先生介绍,DataTurbines数据库的应用场景主要包括4类:实时数据计算,高并发查询,实时风控以及报表加工。他还分享了几个金融行业用户的应用案例,例如,某省银行在线实时数据分析,某省银行大数据平台加工,某证券公司智能数据服务的加速。

  随着金融科技的战略思维越来越多元化,国内市场的成长空间很大,对于既懂技术又懂应用的人才需求也更加迫切。本次研讨会为金融和计算领域的专业人士搭建了一个交流和学习的平台,希望通过研讨会促进金融与计算,尤其是人工智能技术与算法交易、数据分析等场景的深度交叉与融合。由于时间关系,本次研讨会只是抛砖引玉,欢迎大家与我们线下交流,也敬请关注DDN金融行业的更多活动。

  附会议日程及演讲嘉宾简介

  嘉宾简介与报告摘要

  人工智能在金融服务业的应用现状和发展趋势

  张纯信博士 复旦大学泛海国际金融学院学术副院长,金融学教授、金融科技研究中心主任,香港中文大学客座教授。张教授的主要研究领域包括金融科技、投资学、公司金融等。曾荣获美国国家荣誉学者称号。他在国际知名刊物如Journal of Financial Economics, Journal of Corporate Finance, Journal of International Money and Finance, Journal of Derivatives 和 Financial Management 等发表多篇论文。张教授于2003年获得加州大学伯克利分校金融学博士学位。在此之前,他获得了宾夕法尼亚大学沃顿商学院、工程和应用科学学院的金融学学士和电子工程学士学位(1998年)。

  报告摘要

  人工智能目前已渗透到各行各业,从精准营销到社交媒体,从交通到通信,金融行业也不例外。AI和大数据在获客及客服,成本与风险管理方面都有了相当广泛的应用并取得一定成果,同时对信息不对称和相应的投资策略也有了极大的提高,可以说AI重新定位了整个行业的重要指标和盈利模式。本报告基于复旦大学泛海国际金融学院过去三年对行业杰出机构的持续跟踪,结合学术研究、行业专家知识,新商业模式等调研对AI在金融服务业的发展趋势进行了分析并展望各相关机构和认识参考。

  DDN高性能存储在金融服务业的应用案例

  杨志雷先生 DDN大中华区 销售总监, 负责DDN在中国高性能计算、生命科学以及其他高速数据访问、处理领域的市场行销与业务拓展工作,他在磁盘存储、并行文件系统、备份容灾、虚拟化以及高性能计算系统设计方面具备丰富的产品及技术实践积累,并有着深厚的用户、行业、渠道拓展与项目管理经验。杨先生在存储领域有20多年的从业经历,在加入DDN之前,他还曾担任InfiniBand交换设备全球领导厂商Voltaire中国区代表、技术总监等职,全程参与了国家863计划百万亿次计算机(联想深腾7000、曙光5000A)以及千万亿次计算机天河1号等HPC系统设计与安装调优工作,是InfiniBand技术在中国广泛应用的功勋人物。

  报告摘要

  金融服务领域对数据分析、模型计算的需求越来越高,DDN与合作伙伴共同打造的面向金融应用需求的解决方案已逐步在全球各地的对冲基金、投资银行、风险投资公司、证券和保险公司、零售银行以及在线支付公司落地。本次报告分享DDN高性能存储解决方案在金融领域的几个案例,并展示DDN方案的特点和技术优势。

  量化交易:技术、案例与实践

  王子田博士 北京智速科技有限公司 CEO,北京大学博士,专注人工智能、金融建模、量化交易方向。他具有10年数量化交易系统研发经验,曾参与百余家量化机构调研,熟悉中国量化行业。2018年创立北京智速科技有限公司并任CEO,目前还担任中国科学院网络信息中心客座研究员。曾获“北京大学信息学院2009年度学术十杰”称号。在经济与信息学国际期刊有多篇文章发表。2010至2016年主持的多个研究与实践项目获得中国人民银行科技发展奖。

  报告摘要

  本报告介绍量化交易与主观交易的关系,量化投资的核心目标、中国量化投资产业的发展路径,并通过实际案例介绍量化投资与高性能计算如何深度结合,创造超额收益。

  人工智能在量化投研领域中的应用

  赵凡博士 英伟达中国区 金融领域高级解决方案架构师,他主要负责协助英伟达金融领域的客户构建面向大数据分析及人工智能的软硬件系统方案,并为金融领域的相关客户和服务商提供技术支持。

  报告摘要

  如何对金融市场建模并取得超额收益一直都是证券研究的热点话题。随着近几年人工智能的普遍应用,越来越多的研究者尝试使用人工智能技术对金融市场进行建模预测及交易。本报告将简要介绍机器学习、NLP、强化学习等技术在量化投研领域的应用,同时围绕量化投研方面的技术需求,简要介绍英伟达公司的相关软硬件生态。

  面向AI应用的IT架构规划

  付杰先生就职于世界500强某保险集团IT部门,拥有20年基础架构规划、设计、实施和运维经验。同时担任保险IT圈自媒体公众号“落风潭”主笔。

  报告摘要

  本报告首先介绍人工智能(AI)应用对IT架构提出的需求和挑战,以及面向AI应用的架构与传统IT架构的区别。在回顾存储产品演进历程和预测未来发展趋势的基础上,从用户的角度出发提出一些实用的存储选型建议。

  DDN存储架构及金融行业解决方案

  李凡先生 DDN大中华区 存储解决方案架构师,他拥有超过20年存储行业从业经历,专注于人工智能、高性能计算及大数据领域的存储产品解决方案,具有丰富的大规模数据存储设计和建设实践经验。

  报告摘要

  随着“大数据+AI算法”时代的来临,金融服务业中的量化交易已经从简单的“算法+数据库”演化到“机器学习+深度理解”的状态。DDN高速并行存储解决方案配合AI加速计算单元,可提高计算效率,更好地帮助客户解决困境,迎接挑战。

  GPU数据库DataTurbines在金融大数据中的应用

  许盼兮先生上海雅捷信息技术公司 GPU数据库产品总监,他在雅捷信息主要负责GPU技术研发、高性能大数据产品开发、以及金融大数据解决方案的相关工作。许先生毕业于武汉大学电子与通信工程专业,研究方向为GPU高性能计算。他具备十年以上的GPU开发经验,参与开发了一系列GPU相关的高性能软件产品,涵盖石油勘探、安防监控、数据处理等方向。

  报告摘要

  随着大数据时代来临,企业客户数据出现井喷,随之而来的是以分布式数据库为代表的大数据技术的大规模应用。海量数据带来的是数据IO以及计算压力的指数上升。GPU数据库旨在通过GPU硬件上的大缓存、高带宽、多核心等优势,解决当前分布式数据库面临的分布式集群实时响应慢、算力有限以及扩容大集群带来的功耗墙、IO墙等问题。特别是金融OLAP场景下,DataTurbines凭借自研的GPU并行加速算法,结合已经落地的众多案例,给出通用GPU计算技术在大数据背景下的新方案。