-
公开(公告)号:CN119335859A
公开(公告)日:2025-01-21
申请号:CN202411444053.2
申请日:2024-10-16
Applicant: 福州大学
IPC: G05B13/04
Abstract: 本发明涉及基于进化强化学习的无人机‑车辆协作系统双目标优化方法,包括以下步骤:步骤S1:初始化策略种群;步骤S2:使用多智能体强化学习算法训练种群中的所有团队策略;步骤S3:评估所有团队的适应度值;步骤S4:使用团队间的协同进化方法迭代种群中的团队策略,产生新的种群;步骤S5:判断种群策略是否收敛;步骤S6:无人机‑车辆系统根据策略网络协同决策执行感知和数据卸载任务;步骤S7:根据收集到的数据推断未感知区域的数据。该方法结和协同进化算法和多智能体强化学习的优势,利用多智能体强化学习模型学习策略,并通过团队间的协同进化把控全局优化方向,实现异构无人机和车辆的双向策略协同和复杂的合作任务的双目标优化。
-
公开(公告)号:CN117236447A
公开(公告)日:2023-12-15
申请号:CN202311259394.8
申请日:2023-09-27
Applicant: 福州大学
Abstract: 本发明提供一种协同执行多种任务的在线稀疏群智感知方法,由数据收集、数据推断和训练数据更新三个部分组成。首先,通过挖掘真实数据的时空变化规律和相关性,本发明可以使用实时收集到的多任务数据更新训练数据,以保持模型持续更新。接着,本发明提出了一种具有分层架构的多智能体强化学习模型,尝试为每种感知任务分配合适的预算,并执行多种任务数据的协同收集。最后,本发明使用数据推断网络捕捉多种任务数据之间的时空相关性,推断未收集区域的数据,从而进一步降低感知成本,提高数据推断质量。
-
公开(公告)号:CN116611666A
公开(公告)日:2023-08-18
申请号:CN202310732444.3
申请日:2023-06-19
Applicant: 福州大学
IPC: G06Q10/0631 , G06F18/214 , G06Q50/26 , G06N3/006
Abstract: 本发明的目的在于提供一种可同时感知与执行的移动公共资源调度方法,通过两阶段的调度,即考虑短期执行效用也考虑长期预测效用以达到移动公共资源长期覆盖人流量最大化,综合考虑执行效用与感知效用,以达到长期覆盖人流的最大化,保证动态资源的高利用率。
-
公开(公告)号:CN114912029A
公开(公告)日:2022-08-16
申请号:CN202210675748.6
申请日:2022-06-15
Applicant: 福州大学
IPC: G06F16/9535 , G06F16/9537
Abstract: 本发明涉及一种基于强化学习的稀疏群智感知在线用户招募方法,包括以下步骤:步骤S1:获取历史感知数据;步骤S2:构建用户的历史轨迹数据;步骤S3:构建用户招募模型和预算保留模型;步骤S4:训练用户招募模型和预算保留模型;步骤S5:利用预算保留模型判断是否在当前周期保留预算,若判断为“是”,则等待下一个周期到来再重复步骤S5,否则,跳转至步骤S6;步骤S6:招募贡献最大的一个用户,支付其相应的报酬后回到步骤S5;步骤S7:重复步骤S5和S6,直到预算不足或所有周期结束;步骤S8:结合推断算法推断完整的数据。该方法通过交替执行用户招募决策和预算保留决策,在预算和时间限制下,在线招募一组近似最优的用户完成稀疏群智感知任务。
-
-
-