关键词:
共享单车
数据分析
极端随机树
需求量预测
机器学习
摘要:
由于共享单车的流动性强,随机性很高,因此快速精确地预测出城市共享单车的短时需求量具有十分重要的意义。采用随机森林、极端随机树、支持向量机、人工神经网络、XGBoost这5种机器学习方法,基于美国华盛顿共享单车项目数据,分析时间因子、气象因子等对单车需求量的影响,实现对共享单车短时需求量的预测。仿真结果表明,影响单车需求量的主要因素包括温度、节假日、季节以及早晚高峰时间段等因素;极端随机树的预测效果最优,MAE和RMSE最小,为22.93和36.84,训练集得分和验证集得分最高,为1.0和0.941,与随机森林和其它算法相比,鲁棒性高,泛化能力强,且预测结果曲线与真实结果曲线相吻合,预测精度高,可为实际的车辆预测和调度提供参考依据。