-
公开(公告)号:CN119067200A
公开(公告)日:2024-12-03
申请号:CN202411127492.0
申请日:2024-08-16
Applicant: 重庆邮电大学
IPC: G06N3/098 , G06N3/092 , G06N3/042 , G06N3/045 , G06V20/56 , G06V10/82 , G06F21/62 , G06F21/64 , B60W60/00 , B60W50/00 , H04L9/00 , H04W12/00 , H04W12/106 , H04W4/44
Abstract: 本发明涉及一种区块链辅助基于PPO的自动驾驶决策方法,属于移动通信技术领域。智能网联汽车CAV自动驾驶决策模型需要海量的训练数据,然而共享CAV数据将带来隐私泄露和数据安全问题。为了解决上述问题,本发明首先设计了结合有向无环图DAG区块链和联邦学习技术的双层车联网络架构,并基于该架构设计了基于深度确定性策略梯度DDPG算法的异步联邦学习方案;其次,在本地训练阶段,提出基于条件模仿学习CIL的策略网络预训练算法;最后,提出一种基于近端策略优化PPO的自动驾驶决策模型,并在复杂道路场景下设计个性化奖励函数。该方案在提升CAV自动驾驶决策性能的同时,实现低负载CAV协同训练,保证CAV数据隐私安全。