“华为云杯”2020深圳开放数据应用创新大赛 ·深圳北站周边交通拥堵指数预测代码方案
“华为云杯”2020深圳开放数据应用创新大赛 ·深圳北站周边交通拥堵指数预测,题目场景是交通场景,要解决的是一个交通网络的时空预测问题,数据由两类数据构成:交通拥堵指数数据,和网约车轨迹数据。 初赛排名:2/198 决赛排名:3/198
在构建特征过程中,通过滑动窗口的方式构建了道路网络的历史前一小时特征(速度和TTI),当天时间数据:周几、第几个预测时间段,节假日数据:前后节假日时间、节假日信息,通过关键点采样的方式构建了历史前一小时浮动车的速度和流量特征。
在模型训练时使用的是lightGBM模型,lgb速度快且准确度较高,且支持类别数据。
在模型融合阶段,通过使用速度/TTI作为特征,直接预测还是预测和上一时段的差分,使用全部数据还是使用10月之后的数据对模型进行了融合得到了最终结果。