Graph Neural Network for Traffic Forecasting: A Survey

Jiang W ,  Luo J . Graph Neural Network for Traffic Forecasting: A Survey[J].  2021.

(PDF百度就有)

摘要

这篇综述回顾了使用不同图形神经网络的快速增长的研究主体,且是第一篇综合性的调查,探讨了图形神经网络在交通预测问题中的应用。


简介

 简而言之,GNN可以比较好的解决交通问题。

这篇文章确定了最常考虑的问题、图形公式和模型,还调查和总结了公共可用的有用资源,包括数据集、软件和开源代码,用于基于GNN的交通预测研究和应用。最后,确定了将GNNs应用于交通预测问题的挑战和未来方向。目的是为相关工作提供一个全面的总结。创了个开放的GitHub

1)全面回顾:对过去三年(2018-2020年)基于图的交通预测问题解决方案进行了最全面的回顾。

2)资源收集:提供最新的开放数据集和代码资源的全面列表,以便在未来的工作中进行复制和比较。

3)未来方向:讨论了该领域研究人员面临的几个挑战和未来可能的方向。


相关研究调查

在[5]中,突出了三个时空序列预测(STSF)类别,即移动点云轨迹预测、规则网格上的STSF和不规则网格上的STSF。

在[6]中,回顾了时空特征选择和提取预处理方法,这些方法也可以作为内部模型过程嵌入。[

[7]介绍了现有流量预测方法的分类,包括传统方法和深度学习方法。使用公开可用的数据集进行一系列实验,以进行模型性能比较;总结了流量、速度、需求、占用率和旅行时间等预测任务的最新方法。

[14]总结了城市流量预测问题的数据准备过程和预测方法。讨论了三组制备过程:(1)收集时空数据集;(2) 分解城市地图;(3)处理各种数据问题,包括数据丢失、数据不平衡和数据不确定性。还介绍了五种预测方法。

在[18]中,对37个用于交通预测的深层神经网络进行了回顾、分类和讨论。作者得出结论,编码器-解码器长短时记忆(LSTM)与基于图形的方法相结合是最先进的预测技术。还提供了各种数据类型和流行的深度神经网络结构的详细说明,以及交通预测的挑战和未来方向。


问题定义

交通流

三个层次的交通流问题,即道路水平流、区域水平流和站级流。

道路水平流量问题(道路交通流量、道路起点-终点(OD)流量和交叉口交通吞吐量)

在道路交通流问题中,预测目标是在特定时间段内通过道路传感器或道路沿线特定位置的交通量。

在道路OD流量问题中,目标是单个时间点上一个位置(起点)和另一个位置(终点)之间的交通量。

交叉口交通吞吐量问题考虑了通过交叉口的交通量。

区域层面的流动问题考虑了一个地区的交通量。

车站级流量问题与在物理车站(例如地铁站或公共汽车站)测量的交通量有关。

交通速度

考虑了两个级别的交通速度问题,即道路水平和区域水平问题。考虑的具体道路水平速度问题类别包括道路交通速度、道路行驶时间、交通拥堵和到达时间问题;而考虑的区域级速度问题是区域OD滑行速度。

交通需求

所考虑的交通需求问题包括打车需求、出租车需求、共享车辆需求和自行车需求。

其它问题

交通事故和交通异常、停车可用性、城市车辆排放、车道占用率。


图和图神经网络

总结了调查研究中使用的图形和GNN的类型,重点介绍了经常用于交通预测问题的GNN。有关GNN的更广泛和更深入的讨论,请参阅[2]、[229]、[230]。

交通图

图构造:在不同的GNN问题中,节点和边都可以表示不同的属性。

邻接矩阵构造:划分四类,即基于道路、基于距离、基于相似性和动态矩阵。

相似性矩阵分为两个子类型,即交通模式和功能相似矩阵。交通模式相似矩阵表示交通状态之间的相关性。G交通流模式的相似性、不同位置之间的相互依赖性以及不同区域的交通需求相关性。

 使用动态矩阵而不是预定义的邻接矩阵具有优势。

图神经网络

GNN可分为四种类型,即循环GNN、卷积GNN、图形自动编码器和时空GNN[2]。

开放性的数据和资源

原文众多链接。

挑战和未来方向

挑战

1)异构数据:异构数据融合。多外部因素影响。通过考虑底层图结构,gnn已经取得了重大进展。

数据质量:数据缺失、数据系数、噪声。

交通堵塞:正常和异常情况下,收集足够的异常数据来训练深度学习模型(包括gnn)仍然是一个挑战。同样的问题也适用于社会活动、公共假日等。

2)多任务性能:系统的公共服务运营需要一个多任务框架来整合所有的交通信息,同时预测多种交通方式的需求。GNN多任务预测对于不同类型的交通预测问题是一个需要进一步发展的研究方向。

3)实际实施:

首先,现有研究中考虑的少量数据存在明显的偏差,在大多数情况下,这些数据的跨度不到一年。因此,所提出的解决方案不一定适用于不同的时期或不同的地方。

第二个挑战是计算的可伸缩性。为了避免大规模实际交通网络图的巨大计算需求,通常只考虑节点和边的子集。因此,结果只能应用于选定的子集。图划分和并行计算基础设施已经被提出来解决这个问题。

第三个挑战是交通网络和基础设施的变化。当添加或删除道路段或公交线路时,真实世界的网络图会发生变化。根据交通数据中隐藏的空间依赖关系的变化来查找拉普拉斯矩阵的变化,数据自适应图生成,自动推断不同交通序列之间的相互依赖关系。。

4)模型解释:模型解释的挑战是所有“黑盒”机器学习或深度学习模型的一个批评点,交通预测任务也不例外。

未来方向

1)集中式数据存储库:

一个以gnn为基础的交通预测资源的中央数据库将有助于客观比较不同模型的性能,并对该领域作出宝贵的贡献。

2)与其他技术结合:

数据增强:gnn的数据增强被证明有助于半监督节点分类任务[251]。然而,在GNN的交通预测应用中,数据增强是否有效仍是一个问题。

迁移学习:迁移学习利用一项任务训练出来的知识或模型来解决相关的任务,特别是那些数据有限的任务。在交通预测问题中,缺乏历史数据是一个常见的问题,迁移学习是一个可能的解决方案。----[147]提出了一种新的DCRNN迁移学习方法,通过在公路网络数据丰富的区域训练模型来预测公路网络中不可见区域的交通。作者利用PeMS提供的加州公路网络的不同部分,展示了旧金山和洛杉矶地区之间的模型可转移性的有效性。

元学习,或者学习如何学习,最近已经成为一种潜在的学习模式,它可以从一个任务中吸收信息,并有效地将其推广到一个看不见的任务中。

生成对抗网络(GAN)[254]:GAN是一个机器学习框架,它有两个组件,一个生成器,学习生成可信数据,另一个鉴别器,学习区分生成器的假数据和真实数据。在训练到纳什均衡状态后,生成器可能会产生无区别的数据,这有助于扩大许多问题的训练数据规模,包括流量领域的问题。------在[22]中,直接使用路网作为图,其中节点是道路状态检测器,边缘是根据其相邻的链路建立的。利用DeepWalk将图嵌入,将道路交通状态传感器信息转移到低维空间。然后,使用Wasserstein GAN (WGAN)[255]对交通状态数据分布进行训练,生成预测结果。利用公共交通流(即Caltrans PeMSD7)和交通速度(即metro - la)数据集进行评价,结果表明了基于gan的解决方案的有效性。

自动机器学习:机器学习的应用需要在过程的各个方面进行大量的人工干预,包括特征提取、模型选择和参数调整。AutoML自动学习与特征、模型、优化和评估相关的重要步骤,使机器学习模型可以在没有人工干预的情况下应用。AutoML将有助于改进机器学习模型的实现,包括gnn。早期将AutoML与gnn结合用于交通预测问题的尝试是在[62]中提出的Auto-STGCN算法。该算法基于强化学习快速搜索STGCN模型的参数空间,并针对特定场景自动生成最优模型。

贝叶斯网络。研究的目标是确定性模型,做出平均预测。然而,一些流量应用依赖于对未来情况的不确定性估计。种类似的替代方法是分位数回归,它估计在所选点处的分布的分位数函数,结合图小波网进行不确定性估计[170]。


版权声明:本文为CDUTCo原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。