疲劳驾驶数据集_自动驾驶数据集Argoverse Dataset

Argoverse数据集是由Argo AI、卡内基梅隆大学、佐治亚理工学院发布的用于支持自动驾驶汽车3D Tracking和Motion Forecasting研究的数据集。数据集包括两个部分:Argoverse 3D Tracking与Argoverse Motion Forecasting。

1a2f67e3f38d8c9f6be2d5058a2cd7fc.png

Argoverse数据集包含LiDAR数据、 RGB视频数据、前向双目数据、6 DOF的定位数据以及高精地图的数据,所有的数据都跟高精地图数据进行过配准。

Argoverse是第一个包含高精地图的数据集,它包含了290KM的带有几何形状和语义信息的高精地图数据。

803bf8f6a890ee9e3293cf95ae785f64.png
3D visualization of an Argoverse scene

数据收集

8475d7972a93c337114a6ee5a8bc94f0.png
af0308cbd97562beb683027a62eb3111.png

Argoverse高精地图

ce20cfe4eac9614c849e4c53a6afbfc1.png
城市覆盖范围路网长度
Miami788510204KM
Pittsburgh28610486KM

Argoverse高精地图坐标系采用UTM坐标系,UTM将全球分成60个Zone,每个Zone经度方向跨越6度,在UTM基础之上,Argoverse又将坐标系相对于单个城市的固定坐标进行偏移,从而得到最终数据集的地图坐标系。

Argoverse地图包含三个部分:

1) Vector Map of lane centerlines and their attributes

7af5a73667f867d42b808d7c4c343b80.png

2)Rasterized Map of Ground Height

eb22547f731517e9fa6ca8e789e48e84.png

3)Rasterized Map of driveable area and region of interest (ROI)

78ca0dea4f959fca34d44432fd66ebc0.png

高精地图的数据可视化效果如下:

43ee68aeaec3f8d31d1df845afd2a2d4.png
地图车道中心线(Red)和可行驶区域(黄色)
252a6da1d59485bdbf9e3cac0b6739b0.png
路口数据(紫色)
fcfc2be246f99168793a86314ba1b998.png
地图车道的前驱和后继

Argoverse Map的矢量数据(Vector Map)采用扩展的OpenStreetMap(OSM)格式,并提供了Python API用于获取地图数据。

Argoverse Map API

0e5315d79d648928635696dc9a717120.png
Argoverse Map API(Python实现)

3D Tracking

Argoverse数据的3D Tracking包含如下分类:

45c460732bf7296f5b3bb697c4d1cfd4.png

Argoverse Tracker从点云数据(LIDAR Data)中跟踪周围车辆的位置和速度,Tracker的工作流程如下:

Segmentation and Detection

分割检测的过程充分利用了Camera和Lidar各自的特性,首先利用DBSCAN根据点云密度对3D Lidar点云数据进行聚类,然后利用Mask RCNN获取像素空间上的Object Mask,最后对比点云聚类和Mask的结果,丢弃掉图像投影不落在任意一个Mask中的Lidar Cluster。

Association

通过Hungarian Algorithm(匈牙利算法)全局优化关联前后两帧检测的Objects。

Tracking

使用ICP(Iterative Closest Point)来估计相同Object在不同帧的相对变换,然后使用Kalman Filter(ICP的结果作为Measurement)来估计车辆的6自由度姿态和速度。

运动轨迹预测

运动预测(Motion Forecasting)的baseline包含了三类坐标系:

1)City Coordinate System。就是前面提到的地图坐标系。

2)2D curvilinear coordinate system。

如下图所示,将绝对坐标系转换为沿着曲线方向的纵向距离和偏离曲线的横向距离。

a2fc1f12dcd65168efdcd19fe06c857e.png

3)Trajectory Normalization

在不使用Map的情况下,对Trajectory做归一化处理,所有Observation的起始位置位于(0,0),结束位置位于x轴上。事实证明,Normalization的效果比Absolute Map Coordinates或者Absolute Orientations的效果好。

Feature提取

Baseline使用距离Agent前后Object的distance来捕获Social Context,使用2D curvilinear coordinate system来捕获Map context。

Baseline模型

基于Social Feature和Map Feature,Argovese提供了一系列的Baseline模型:Constant Velocity, Nearest Neighbor和LSTM Encoder-Decoder模型等。

Prediction Metric

minADE = minimum Average Displacement Error,对于多轨迹线预测,minADE是FDE最小的轨迹的ADE。

minFDE = minimum Final Displacement Error。

minFDE只能评估最好的估计有多好,但不能评估所有轨迹的优劣。为了解决这个问题,论文中提出了新的Metric:Drivable Area Compliance (DAC),假设Model生成了n条未来可能的轨迹,其中m条轨迹超出了Drivable Area的范围,那么DAC = (n - m) / n, DAC的值越大意味着预测的效果越好。

另外论文中也使用了Miss Rate (MR)的Metric,如果有n条轨迹,其中m条轨迹的最后的坐标距离Ground Truth超过2m,那么miss rate=m/n。

0926ddf935b4f87ac00828faff5352b6.png
Motion Forecasting Errors for different number of prediction
b0b15addb80980b93f639489f4c059a0.png
运动预测Baseline的定性结果

参考材料

1.https://arxiv.org/pdf/1911.02620.pdf

2.https://www.argoverse.org/data.html#maps-link

7c0be7c94b72759e6af3099fe99447b1.png

版权声明:本文为weixin_39914107原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。