-
公开(公告)号:CN117835329B
公开(公告)日:2024-07-05
申请号:CN202410241235.3
申请日:2024-03-04
Applicant: 东北大学
IPC: H04W28/084 , H04W4/029 , H04W4/48 , H04W4/44 , G06N3/0442 , G06N3/0455 , G06N3/096
Abstract: 本发明属于边缘计算应用技术领域,公开一种车载边缘计算中基于移动性预测的服务迁移方法。获取车辆位置数据,使用车辆移动性预测模型预测车辆位置;根据预测的车辆位置,使用预测误差估计模型进行预测误差估计,并根据估计的预测误差修正车辆位置预测结果;基于修正的车辆位置预测结果,通过服务迁移决策模型制定基于双策略蒸馏深度强化学习服务迁移策略。本发明可以减少服务迁移的中断时间。通过使用两个深度强化学习模型互相学习的方式,加快模型的学习速度,增强模型的探索能力,提升模型决策的效果。通过引入动作价值函数,让服务迁移策略的评价不再只依赖于状态价值函数,而是转换为动作价值函数与状态价值函数的比较,以提升蒸馏效率。
-
公开(公告)号:CN117835329A
公开(公告)日:2024-04-05
申请号:CN202410241235.3
申请日:2024-03-04
Applicant: 东北大学
IPC: H04W28/084 , H04W4/029 , H04W4/48 , H04W4/44 , G06N3/0442 , G06N3/0455 , G06N3/096
Abstract: 本发明属于边缘计算应用技术领域,公开一种车载边缘计算中基于移动性预测的服务迁移方法。获取车辆位置数据,使用车辆移动性预测模型预测车辆位置;根据预测的车辆位置,使用预测误差估计模型进行预测误差估计,并根据估计的预测误差修正车辆位置预测结果;基于修正的车辆位置预测结果,通过服务迁移决策模型制定基于双策略蒸馏深度强化学习服务迁移策略。本发明可以减少服务迁移的中断时间。通过使用两个深度强化学习模型互相学习的方式,加快模型的学习速度,增强模型的探索能力,提升模型决策的效果。通过引入动作价值函数,让服务迁移策略的评价不再只依赖于状态价值函数,而是转换为动作价值函数与状态价值函数的比较,以提升蒸馏效率。
-
公开(公告)号:CN117688257A
公开(公告)日:2024-03-12
申请号:CN202410120177.9
申请日:2024-01-29
Applicant: 东北大学
IPC: G06F16/9537 , G06F18/23213 , G06F18/22 , G06N3/092
Abstract: 本发明属于智能交通技术领域,公开了一种面向异构用户行为模式的长期轨迹预测方法。度量轨迹中多个维度的相似性,构建可学习的距离权重矩阵,获得融合多维距离得分;构建邻接矩阵,进行轨迹聚类,聚类结果用于强化学习中优化可学习的距离权重矩阵中的参数;使用轨迹聚类每一个聚类簇中的轨迹数据训练轨迹预测模型,训练后的轨迹预测模型作为轨迹预测。本发明将具有相同行为模式的轨迹划分在一个类内差异较小的簇中,然后使用引入时间和速度信息编码的堆叠Transform结构来提取并融合多属性轨迹中的多维特征,并进一步产生长期轨迹预测结果。对于智能交通场景,面向异构用户行为模式的长期轨迹预测方法具有相当的适用价值。
-
公开(公告)号:CN117688257B
公开(公告)日:2024-07-05
申请号:CN202410120177.9
申请日:2024-01-29
Applicant: 东北大学
IPC: G06F16/9537 , G06F18/23213 , G06F18/22 , G06N3/092
Abstract: 本发明属于智能交通技术领域,公开了一种面向异构用户行为模式的长期轨迹预测方法。度量轨迹中多个维度的相似性,构建可学习的距离权重矩阵,获得融合多维距离得分;构建邻接矩阵,进行轨迹聚类,聚类结果用于强化学习中优化可学习的距离权重矩阵中的参数;使用轨迹聚类每一个聚类簇中的轨迹数据训练轨迹预测模型,训练后的轨迹预测模型作为轨迹预测。本发明将具有相同行为模式的轨迹划分在一个类内差异较小的簇中,然后使用引入时间和速度信息编码的堆叠Transform结构来提取并融合多属性轨迹中的多维特征,并进一步产生长期轨迹预测结果。对于智能交通场景,面向异构用户行为模式的长期轨迹预测方法具有相当的适用价值。
-
公开(公告)号:CN117880858A
公开(公告)日:2024-04-12
申请号:CN202410275005.9
申请日:2024-03-12
Applicant: 东北大学
Abstract: 本发明属于机器人智能决策与控制技术领域,公开了一种基于通信学习的多无人机轨迹优化和功率控制方法,能够在较低能耗的情况下最大化满足服务质量的用户数量。本发明设计了一个通信机制,增设记忆存储设备以帮助UAV‑ABS获取和利用其他无人机的经验,并存储自身学习到的经验。为了构建更有效的无人机合作策略并降低网络模型部署的成本,本发明设计了集中注意力评论家神经网络,能够减少冗余信息,并解决随着UAV‑ABS和地面用户数量增加而出现的维度灾难问题。
-
公开(公告)号:CN119907049A
公开(公告)日:2025-04-29
申请号:CN202510114803.8
申请日:2025-01-24
Applicant: 东北大学
IPC: H04W28/08 , H04W28/084 , H04W84/06 , G06N3/092 , G06N3/0442 , G06N3/0499
Abstract: 本发明属于卫星边缘计算领域,公开一种卫星边缘计算中星地协同服务迁移方法。构建信息提取结构进行信息提取,得到关键时序信息;设计一种星地协同的服务迁移多智能体强化学习算法,关键时序信息作为星地协同的服务迁移多智能体强化学习算法中的观测值,强化学习得到最优服务迁移策略。本发明提出结合时间注意力机制和双向门控循环单元的信息提取方法,有效捕捉历史数据中的时序模式,提高服务迁移决策精度。结合地面基站与低轨卫星网络的协同优化,采用Actor‑Critic结构和全局Critic机制,优化跨网络服务迁移,降低迁移成本和服务中断时间,提升用户服务体验。本发明在奖励值、迁移成本和用户获取服务时延方面表现出显著优势。
-
公开(公告)号:CN119907047A
公开(公告)日:2025-04-29
申请号:CN202510112286.0
申请日:2025-01-24
Applicant: 东北大学
IPC: H04W28/08 , H04W84/06 , G06N3/092 , H04L41/147 , H04L41/16
Abstract: 本发明属于任务卸载技术领域,公开一种基于分块流量预测的无人机辅助任务卸载方法。为了同时解决用户分布频繁变化导致的无人机部署与任务卸载问题,设计分块流量预测模块、任务卸载模块和无人机轨迹优化模块。输入当前时隙的用户分布时序信息获取预测到的未来用户分布信息;根据当前任务、用户和无人机的相关参数制定最佳卸载决策来最小化用户的延迟与能耗;使用多智能体强化学习算法并在分块流量预测模块、任务卸载模块基础上搭建环境,然后收集环境参数数据进行训练以便获取无人机部署方案优化无人机的飞行轨迹。本发明所提出的方法在用户分布频繁变化的场景中既解决了任务卸载决策制定问题,同时也解决了无人及部署难题,优于其他现有方法。
-
公开(公告)号:CN117880858B
公开(公告)日:2024-05-10
申请号:CN202410275005.9
申请日:2024-03-12
Applicant: 东北大学
Abstract: 本发明属于机器人智能决策与控制技术领域,公开了一种基于通信学习的多无人机轨迹优化和功率控制方法,能够在较低能耗的情况下最大化满足服务质量的用户数量。本发明设计了一个通信机制,增设记忆存储设备以帮助UAV‑ABS获取和利用其他无人机的经验,并存储自身学习到的经验。为了构建更有效的无人机合作策略并降低网络模型部署的成本,本发明设计了集中注意力评论家神经网络,能够减少冗余信息,并解决随着UAV‑ABS和地面用户数量增加而出现的维度灾难问题。
-
-
-
-
-
-
-