基于Double DQN的改进深度强化学习方法及系统

    公开(公告)号:CN111461321A

    公开(公告)日:2020-07-28

    申请号:CN202010169230.6

    申请日:2020-03-12

    Abstract: 本发明公开了一种基于Double DQN的改进深度强化学习方法及系统,属于强化学习领域,该方法包括以下步骤:初始化环境和DQN网络参数;基于ε-贪婪策略进行经验积累,并将经验存入回放记忆单元;利用回放记忆单元中的样本对DQN网络进行训练优化获得决策网络。本发明方法可以提高Double Q-Learning Network的收敛速度,并优化最终收敛值,且能减小噪声对DQN算法效果的干扰,提高深度强化学习在实际生产生活中的应用效果,扩大其应用范围。

    基于DDPG算法的电子健康网络计算卸载方法

    公开(公告)号:CN116779082A

    公开(公告)日:2023-09-19

    申请号:CN202210224560.X

    申请日:2022-03-07

    Abstract: 本发明公开了一种基于DDPG算法的电子健康网络计算卸载方法。该方法包括:确定电子健康网络架构,初始化必要的网络参数;然后将寻找最优的计算卸载策略问题转化为马尔科夫决策问题;最后采用DDPG算法对计算卸载模型进行训练,得到通信连接和卸载策略,使得各个用户在动态环境下获得合适的通信资源和计算资源。本发明不仅解决了移动设备本地计算资源受限的问题,在多WBAN用户多MEC的场景下还能显著地减少系统的时延和能耗,可以广泛应用在居家医疗、运动健身、疾病防控和医疗监测等场合中。

    基于DQN算法的电子健康网络区块链共识方法

    公开(公告)号:CN116779081A

    公开(公告)日:2023-09-19

    申请号:CN202210224557.8

    申请日:2022-03-07

    Abstract: 本发明公开了一种基于DQN算法的电子健康网络区块链共识方法。该方法包括:确定支持区块链交易的电子健康网络架构,并设计区块链信誉评分机制即计算网络参数;然后将区块链共识问题建模为MDP并采用DQN算法对区块链共识方法进行训练。最后根据决策网络自适应分配哈希资源,以便得到最大化的边缘服务器总体收入。本发明提出的方法能够有效解决MEC环境的信任和隐私问题,获得最佳的网络服务性能,能在居家医疗、运动健身、战场士兵和疗养监测等场合中被广泛应用。

    基于深度残差网络的移动终端人类情境识别方法

    公开(公告)号:CN113095153A

    公开(公告)日:2021-07-09

    申请号:CN202110297073.1

    申请日:2021-03-19

    Abstract: 本发明公开了一种基于深度残差网络的移动终端人类情境识别方法。该方法如下:初始化移动终端系统参数;初始化深度残差网络参数,包括网络层数、每层神经元的个数、激活函数、池化函数和池化窗、卷积核;对传感器数据进行预处理;对深度残差网络进行训练优化;利用优化后的深度残差网络识别人类情境。本发明方法可以提高基于传感器数据的移动终端人类情境识别的准确率,减少了识别误差;能提高移动终端系统识别人类情境的能力,可以被广泛应用于活动识别、姿态预测等移动终端实际应用场景。

    无线体域网中基于DQN算法的动态节点调度方法

    公开(公告)号:CN111465031A

    公开(公告)日:2020-07-28

    申请号:CN202010221489.0

    申请日:2020-03-26

    Abstract: 本发明公开了一种无线体域网中基于DQN算法的动态节点调度方法。该方法包括以下步骤:确立无线体域网的网络架构;建立节点之间的马尔科夫信道模型,进行无线通信信道质量的数据采集并计算模型参数;将节点调度问题转化为马尔科夫决策问题,并采用基于深度强化学习的DQN算法进行训练,获得收敛的决策网络;利用决策网络进行节点调度:每个时刻根据节点的信道和缓存区数据长度决定接入信道的节点及其发送功率。本发明方法在保证无线体域网数据传输的可靠性和公平性的基础上,提高了节点调度的能效性,延长了网络的生存周期,可以被广泛应用于医疗监测、疾病防控等体域网实际应用场景。

    基于强化学习的智能终端传感器调度方法

    公开(公告)号:CN111459627A

    公开(公告)日:2020-07-28

    申请号:CN202010169038.7

    申请日:2020-03-12

    Abstract: 本发明公开了一种基于强化学习的智能终端传感器调度方法,该方法包括以下步骤:为智能终端系统定义新的参数窗口;初始化智能终端系统参数和DQN网络;优化窗口的长度;对DQN网络进行训练优化,获得决策网络;利用获得的决策网络调度传感器。本发明方法可以提高智能终端系统传感器触发策略的实时性和有效性,减少了传感器能耗,延长了传感器使用寿命。本发明能提高智能终端系统更精确快捷地服务人类生活的能力,可以被广泛应用于医疗监测、疾病防控等移动终端实际应用场景。

    无线体域网中基于DQN算法的动态节点调度方法

    公开(公告)号:CN111465031B

    公开(公告)日:2022-10-14

    申请号:CN202010221489.0

    申请日:2020-03-26

    Abstract: 本发明公开了一种无线体域网中基于DQN算法的动态节点调度方法。该方法包括以下步骤:确立无线体域网的网络架构;建立节点之间的马尔科夫信道模型,进行无线通信信道质量的数据采集并计算模型参数;将节点调度问题转化为马尔科夫决策问题,并采用基于深度强化学习的DQN算法进行训练,获得收敛的决策网络;利用决策网络进行节点调度:每个时刻根据节点的信道和缓存区数据长度决定接入信道的节点及其发送功率。本发明方法在保证无线体域网数据传输的可靠性和公平性的基础上,提高了节点调度的能效性,延长了网络的生存周期,可以被广泛应用于医疗监测、疾病防控等体域网实际应用场景。

    基于Q-Learning的移动终端传感器调度方法

    公开(公告)号:CN113095140B

    公开(公告)日:2022-08-16

    申请号:CN202110271812.X

    申请日:2021-03-12

    Abstract: 本发明公开了一种基于Q‑Learning的移动终端传感器调度方法。该方法包括以下步骤:为移动终端系统定义新的参数:窗口,一个窗口表示一个时间段;初始化移动终端系统参数和Q值表;确定窗口的长度;对Q值表进行训练优化,获得训练后的Q值表;利用获得的Q值表调度传感器。本发明可以提高移动终端系统传感器触发策略的实时性和有效性,减少了传感器能耗,延长了传感器使用寿命;此外,本发明能提高移动终端系统更精确快捷地服务人类生活的能力,可以被广泛应用于医疗监测、疾病防控等移动终端实际应用场景。

    基于Q-Learning的移动终端传感器调度方法

    公开(公告)号:CN113095140A

    公开(公告)日:2021-07-09

    申请号:CN202110271812.X

    申请日:2021-03-12

    Abstract: 本发明公开了一种基于Q‑Learning的移动终端传感器调度方法。该方法包括以下步骤:为移动终端系统定义新的参数:窗口,一个窗口表示一个时间段;初始化移动终端系统参数和Q值表;确定窗口的长度;对Q值表进行训练优化,获得训练后的Q值表;利用获得的Q值表调度传感器。本发明可以提高移动终端系统传感器触发策略的实时性和有效性,减少了传感器能耗,延长了传感器使用寿命;此外,本发明能提高移动终端系统更精确快捷地服务人类生活的能力,可以被广泛应用于医疗监测、疾病防控等移动终端实际应用场景。

Patent Agency Ranking