[DDN自动驾驶解决方案] 如何利用数据 促进自动驾驶系统进化
发布时间:
2022-04-15 00:00
【导读】智能驾驶的能力取决于高效的数据闭环和数据的利用效率。本文简单介绍了典型的自动驾驶数据工作流程,并分析了智能驾驶系统开发所面临的数据挑战。无论是数据摄取、模型训练还是仿真验证,都离不开强大的计算平台和存储技术的支撑。先进基础设施如何赋能自动驾驶技术?欢迎车企、自动驾驶解决方案提供商等业内人士参加4月26日 (周二) 下午3:00-5:00 举行的自动驾驶在线研讨会。
当前,汽车产业正在经历着智能化、网联化、电动化、自动化(新四化)的变革,其中,智能化被广泛认为是新四化的基石和核心。国际汽车工程师协会(SAE)将自动驾驶划分为5个级别,随着智能化等级从驾驶员辅助(L1), 部分自动化(L2), 有条件自动驾驶(L3),到高度自动驾驶(L4)和全自动化的无人驾驶(L5)的提高,人与车之间的关系也由人主导向自动驾驶系统主导演进。

自动驾驶数据工作流程
智能驾驶系统的开发需要经过数据采集、数据集构建、模型训练以及仿真测试等一系列不断迭代的工作,智能驾驶能力取决于高效的数据闭环和数据的利用效率。一个典型的自动驾驶数据工作流程如下图所示:首先,测试车的各种传感器采集的数据经过压缩保存在车内的固态硬盘(SSD) 中;这些数据通过车内固态硬盘的卸载、运输并安装在区域计算数据中心的服务器中。在区域数据中心,经过清洗、去重后的数据将同步到核心数据中心;在核心数据中心,会进行数据转换、训练和仿真;经过验证的模型将部署到测试车,然后开始新一轮工作流程。我们以训练和仿真环节为例做一下简单的介绍。
训练深度神经网络(DNN)
如何为自动驾驶设计DNN并没有单一的方法。采用集成方法在实践中比较常见,即训练多个DNN用于不同类型的问题如路径规划、物体识别、读交通标志、检测红绿灯状态等。然而,训练并非一蹴而就,需要定期反复进行迭代。由此可见,训练所需的计算量相当大。
目前,基于GPU的集群被广泛用于深度学习训练。一些头部自动驾驶解决方案开发商的训练集群所配备的GPU已超过2万块,并仍在继续扩大规模。从IO的角度来看,要让这些GPU保持忙碌和高利用率,就需要高带宽、低延迟、高并发的并行存储系统来传输数据。DDN的 A3I 存储解决方案匹配英伟达的DGX系统组成的POD架构在深度学习训练方面很有优势,经过实践证明:A3I 存储可确保GPU的数据饱和,助力训练任务的快速完成。由于POD基于模块化设计,随着训练任务的增加,可轻松实现计算能力和存储容量的可预测扩展。
仿真/二次仿真(Re-simulation)
对于大部分自动驾驶项目来说,仿真是开发流程中关键的一环。通过在各种驾驶环境中的模拟仿真可以快速测试DNN。初次仿真之后,还可以使用二次仿真,即回放以前记录的传感器数据(而不是合成数据)来测试软件堆栈。例如:二次仿真过程中,结合来自自动紧急制动场景下的实际传感器数据,来消除误报情况。
目前,自动驾驶仿真本身还处于研究和创新的过程之中。要实现成功的仿真,需考虑以下几个方面:
1. 达到必要的分辨率,为所有车载传感器实时提供逼真的输入
2. 为研发中的多种DNN集合提供必要的推理性能,可能需要许多仿真流并行
3. 对汽车、自行车、行人和其他非静止物体进行准确的建模
数据挑战
由于每辆测试车收集来自多种传感器的海量数据(>2PB/测试车/年),因此智能驾驶系统的开发面临着极大的数据挑战:
1. 如何创建一个数据管道来高效地将数据从测试车辆迁移到训练集群
2. 如何高效地准备、清洗和标注数据以用于深度神经网络的训练
3. 需要多少存储和算力来训练神经网络?应该采用本地部署还是云上的集群进行训练?
4. 如何确定基础设施的规模(包括存储、网络带宽和计算能力)才能满足数据管道和训练集群的需求?
5. 还应该考虑哪些其他的数据流?
为了探讨这些问题,DDN公司将于4月26日(周二)下午3:00-5:00 举办在线研讨会,邀请自动驾驶行业的用户以及计算/存储解决方案架构师共同讨论。分享的话题主要涉及自动驾驶基础设施解决方案、应用场景和用户实践,详细日程将于近期公布,欢迎您扫码注册参会。

相关新闻