近年来,随着科学技术的快速发展,利用各种深度学习算法投资于各个研究行业已经取得了一些重大突破。在交通运输行业,也将先进技术与信息相结合,掌握数据的采集、使用和传输。 ,其目的是为用户提供更好的服务质量,其核心价值是在安全的情况下提供人们的实时需求,因此有必要通过过去的数据和分析来预测未来可能的情况。因此,本研究利用长时记忆LSTM算法建立多元模型来预测6702线路上每个班次的总出行时间和站点之间的出行时间,并利用出行时间数据中的前一总出行时间来预测预测未来7天内该路线的总出行时间和区间出行时间,观察节日、星期和降雨量变量的预报变化,通过平均绝对误差MAPE的比较来调整预报模型结果的参数,以实现最佳预测模型预测未来 7 天的出行时间 经过研究发现,最佳预测模型的平均绝对误差 MAPE 为 3.67%,说明该模型的预测结果非常优秀 关键词:长 短术语记忆、旅行时间、深度学习。
前言
- 研究緣起
- 研究目的
- 研究範圍
- 研究流程
将收集的数据分为训练集和测试集,构建LSTM深度学习模型。根据LSTM深度学习模型的误差评估,将使用最好的预测模型来进行预测。
文獻回顧
深度學習在交通之應用
- 深度神經網路 (Deep Neural Networks, DNN)
- 人工神經網路(Artificial neural network, ANN)
- 卷積神經網路(Convolutional neural network, CNN)
- 循環神經網路(Recurrent neural network, RNN)
- 長短期記憶演算法(Long short-term memory,LSTM)
Liu(2017),基于深度神经网络(DNN)的方法。图8.循环神经网络2.2.5长期短期记忆(LSTM)算法。
綜合討論
在处理长序列数据时,RNN的长期记忆力不足,无法记住数据的长期规律性。 LSTM 有一条垂直贯穿所有单元状态的主存储线。结合输入连接和循环连接,影响某个时间点的未来状态,每个单元有3个小门(门),有自己的权重矩阵,内存控制就是通过这个小门来完成的,第一层逻辑是第二步是记录带入单元的新数据,第三步是通过 tanh 激活函数计算向量,更新单元,最后将数据提取到主存中。
資料清理
- PTX 平台公車動態(A1)資料
- 天氣觀測資料
- 行政院人事行政局初公布之 109 年日曆表
- 統整資料格式
利用人力资源办公室日历收集2019年1月1日至2019年2月11日的节日数据,并以公共假期作为本研究纳入的节日变量。如果是公共假期,则该变量为1,即不是公共假期。根据以上数据进行采集和删除,将出行时间数据、降雨量数据、周数据和节日数据采集成csv文件,按照每个班次划分文件,日期命名为date,旅行时间被命名为时间, 。
預測模式建構
Python 介紹
- Keras 套件
- Tensorflow 套件
- Numpy 套件
- Pandas 套件
- Matplotlib 套件
基于Numpy用于数据分析的增强版,可以处理类似于Excel电子表格的表格数据,读取cvs文件,删除、添加、替换字段等,可以处理顺序和非顺序时间序列数据、行矩阵数据和列标签、统计数据等,主要常用的数据结构有一维数据系列和二维数据表DataFrame数据结构,每列可以是不同的数据类型,如数值、字符串等。 。此外,Pandas 还有几个优点。例如,它可以处理浮点数和非浮点数的缺失数据。自动转换数据更加直观,将Python和Numpy中顺序不正确或索引不同的数据转换为表格数据可以清晰呈现。
旅行時間預測模式建構
以翻译和图像搜索的应用为例,因为TensorFlow擅长处理分类和推理预测模型。 Matplotlib 是 MATLAB、Plot 和 Library 的缩写。它用于数据科学和机器学习的视觉呈现。是模仿MATLAB构建的绘图库,同样应用了Numpy的相关代码,目的是提高对大量数据的处理,可以处理二维和三维图,可以画线图, 。
損失函數評估
- 各模式損失函數評估
卓奈坦-田中区间的模型训练还采用了损失函数(loss)和平均绝对误差(MAE)的双重评估方法来保证训练模型的有效性。通过训练数据进行损失函数评估,发现卓乃坦-田中一班损失函数随着训练次数的增加呈现下降趋势,说明模型训练效果良好,通过平均绝对误差MAE,观察到训练数据确实呈现下降趋势,方便后续预测,田中驾驶区间的模型训练也是如此。采用损失函数(loss)和平均绝对误差(MAE)双重评价方法保证训练模型的有效性,通过训练数据对损失函数进行评价,发现Tanaka-Che的损失函数一阶偏移随着训练次数的增加呈下降趋势,说明模型训练效果良好,通过平均绝对误差MAE观察训练数据确实呈现下降趋势,方便后续预测。
變數與參數分析
- 變數調整
- MAPE 預測能力量表
- 參數調整
表 47. 添加隐藏层 2 改变卓乃潭-元林的第二个转变 表 49. 添加隐藏层 2 改变卓乃潭-元林的第二个转变。
模式比較
图 78. (元林卓乃潭) 各航班出行时间模式比较图 3) (卓乃潭田中) 各航班出行时间模式比较图 图 80. (田中火车城) 各航班出行时间模式比较图每个航班的旅行时间模式 MAPE。
歷史平均模型
4)(田中车城)历年出行时间格局对比图 图81 第一年总出行时间历史平均模型(员林车城)。
模式預測
2) (YuanlinZhuo Naitan) 区间出行时间模型预测误差结果 3) (Zhuo NaitanTanaka) 区间出行时间模型预测误差结果。
綜合討論
- 與文獻誤差比較
- 與現況誤差比較
- 綜合分析
LSTM模型的预测结果小于当前情况预测的MAPE,这表明使用LSTM模型可以更准确地预测出行时间表107、当前情况和本研究的MAPE汇总表。在行程时间预测之前,使用损失函数来评估训练模型的优缺点,通过以上章节的分析可以发现,损失函数以及预测值与实际值的平均绝对误差表现出随着训练次数的增加呈下降趋势,说明模型训练效果良好,后期应输入测试数据进行预测。 ,防止训练模型的误差影响最终的预测结果。
加值應用分析
旅行時間預報
在网站左上角的更多信息栏中,您可以访问网站另一侧的出行时间预测页面下载地图数据。点击屏幕上的日期,会以直观的方式带色差显示,并通过超链接连接到数据库,用户点击日期后可以自由下载所需的信息,点击范围也设置为在下周的时间下载数据,并且用户可以保存到设备中以便于查阅记录。预计行程时间显示为 6702 会员 从林到车城的预计行程总时间为每天六次往返,第一班至第三班用数字 1-3 表示,左侧时间为发车时间,右边的时间是预计到达时间,箭头方向 轴的颜色代表出行时间的长短,绿色箭头代表预计时间小于105分钟,比平均出行时间快,黄色箭头在105到114分钟之内,红色箭头代表预计时间超过115分钟,用户可以用直观的方法选择最适合自己的航班。
結論建議
結論
通过参数拟合找到总出行时间和区间出行时间误差最小的预测模型,并将模型带入测试集中进行后续预测。区间出行时间预测显示未来7天内出行时间的变化,并将针对后续增值应用进行延长。
建議
点击区域设置为下周内可以下载数据的时间,为用户未来出行规划提供参考。对出行时间的深度学习研究可以包括温度、不同时间的交通量、障碍物对道路的影响(号旗管制等变量的观测周期变化的影响)。