-
公开(公告)号:CN112288233A
公开(公告)日:2021-01-29
申请号:CN202011050958.3
申请日:2020-09-29
Applicant: 南京大学
Abstract: 本发明公开了一种适于乘客等待时间分布随时间变化的网约车订单分配方法,包括:根据乘客等待时间分布变化范围计算出该分布变化范围下批处理算法对应的最优的匹配间隔并对不同的乘客等待时间分布训练不同的深度强化学习模型,将上述具有不同匹配间隔的批处理算法和适应不同乘客等待时间分布的深度强化学习模型合并为一个算法集合;当有订单到来时,采用预设的选择模型在算法集合中选择其中一个算法进行分配订单,根据收益反馈对选择模型中的参数进行更新;结合收益反馈检测乘客等待时间分布是否变化,若发生变化则重启选择模型并清空反馈记录。本发明能够随乘客等待时间和数目分布变化而不断调整分配从而最大化网约车平台收益。
-
公开(公告)号:CN112288233B
公开(公告)日:2023-09-12
申请号:CN202011050958.3
申请日:2020-09-29
Applicant: 南京大学
IPC: G06Q10/0631 , G06Q30/0601 , G06Q30/0645 , G06N3/049 , G06N3/084 , G06N3/092
Abstract: 本发明公开了一种适于乘客等待时间分布随时间变化的网约车订单分配方法,包括:根据乘客等待时间分布变化范围计算出该分布变化范围下批处理算法对应的最优的匹配间隔并对不同的乘客等待时间分布训练不同的深度强化学习模型,将上述具有不同匹配间隔的批处理算法和适应不同乘客等待时间分布的深度强化学习模型合并为一个算法集合;当有订单到来时,采用预设的选择模型在算法集合中选择其中一个算法进行分配订单,根据收益反馈对选择模型中的参数进行更新;结合收益反馈检测乘客等待时间分布是否变化,若发生变化则重启选择模型并清空反馈记录。本发明能够随乘客等待时间和数目分布变化而不断调整分配从而最大化网约车平台收益。
-