基于多Agent环境的深度强化学习算法、设备和存储介质

    公开(公告)号:CN115392438B

    公开(公告)日:2023-07-07

    申请号:CN202211114004.3

    申请日:2022-09-14

    Abstract: 本申请提供一种基于多Agent环境的深度强化学习算法、设备和存储介质,涉及深度强化学习算法技术领域;通过步骤S101、利用Agent中的目标网络,基于初始状态信息和动作信息,确定时间差分;步骤S102、根据预设的遮盖率,对初始状态信息进行随机遮盖,得到目标状态信息,利用Agent中的预测网络,以及时间差分,确定误差值;步骤S103:基于误差值,以及自适应修改参数,对Agent中的预测网络和目标网络各自对应的加权值进行更新;步骤S104:重复步骤S102和步骤S103预设次数,确定目标加权值,从而确定目标深度强化学习模型。具有保证了样本学习效率,并通过自适应修改参数对深度强化学习模型中的Agent进行迭代更新,以提高收敛速度的效果。

    一种多Agent深度强化学习算法
    3.
    发明公开

    公开(公告)号:CN113902087A

    公开(公告)日:2022-01-07

    申请号:CN202111240522.5

    申请日:2021-10-25

    Abstract: 本发明公开了一种多Agent深度强化学习算法,包括:S1:学习的策略在执行时只使用本地信息,即它们自己的观察结果;S2:智能体之间的通信方法不做任何结构上的假设,即不假设一个可区分的通信渠道;S3:leader层网络只输入全局智能体的状态信息,只作用于每个智能体的输出动作值,并不参与每个智能体的策略执行,既保持每个智能体的独立性,又保证所有智能体群体之间的通信。本发明通过在分布式执行之前加入集中式预判分配权重,增强了智能体群体之间的决策通信,提高了Leader_MADDPG在多变的环境关系中智能体训练过程中的稳定性和训练后的鲁棒性。

    一种基于深度学习和特征融合的皮肤病变图像分割方法

    公开(公告)号:CN115311230A

    公开(公告)日:2022-11-08

    申请号:CN202210941767.9

    申请日:2022-08-08

    Abstract: 本发明提供了一种基于深度学习和特征融合的皮肤病变图像分割方法,建立使用了编码器‑解码器结构的用于皮肤病变图像分割的模型,在模型的特征编码路径上使用EfficientNet进行了特征的学习,在特征解码路径上使用密集特征融合方法增强解码器的解码能力,并且采用了门控完全特征融合模块来提升特征融合的质量,产生解码后的特征图,解码器在最后产生输入图像的分割结果,完成皮肤病变图像的分割处理。本发明使用了更为先进的EfficientNet作为模型的编码器,使得本申请模型编码器的参数数量减少而且特征学习能力增强。通过门控机制增强了有用的编码信息向解码路径的传递,抑制了无用的特征信息所带来的干扰,提升了模型的特征融合能力。

    基于多Agent环境的深度强化学习算法、设备和存储介质

    公开(公告)号:CN115392438A

    公开(公告)日:2022-11-25

    申请号:CN202211114004.3

    申请日:2022-09-14

    Abstract: 本申请提供一种基于多Agent环境的深度强化学习算法、设备和存储介质,涉及深度强化学习算法技术领域;通过步骤S101、利用Agent中的目标网络,基于初始状态信息和动作信息,确定时间差分;步骤S102、根据预设的遮盖率,对初始状态信息进行随机遮盖,得到目标状态信息,利用Agent中的预测网络,以及时间差分,确定误差值;步骤S103:基于误差值,以及自适应修改参数,对Agent中的预测网络和目标网络各自对应的加权值进行更新;步骤S104:重复步骤S102和步骤S103预设次数,确定目标加权值,从而确定目标深度强化学习模型。具有保证了样本学习效率,并通过自适应修改参数对深度强化学习模型中的Agent进行迭代更新,以提高收敛速度的效果。

    一种基于图卷积的医疗图像分割方法

    公开(公告)号:CN115205306A

    公开(公告)日:2022-10-18

    申请号:CN202210922193.0

    申请日:2022-08-02

    Abstract: 本发明提供了一种基于图卷积的医疗图像分割方法,包括以下步骤:对于监督学习,使用图卷积网络配合卷积神经网络分割框架;先利用全卷积网络提取出医学图像的深层次特征,对提取出来的特征构建图的三元组信息,最后使用图卷积网络进行训练,弥补卷积网络带来的局部位置信息的损失;对于无监督域适应学习,使用双曲图卷积网络融合,对抗学习域适应网络框架。本发明有监督是情况下,通过使用U‑Net网络提取医学图像的特征信息,通过高斯核或朴素方式构建图信息,送入图卷积网络进行训练;无监督情况下,选择使用双曲图卷积模型替代图卷积网络。使用图卷积网络和双曲图卷积网络可以扩大感受范围,提高了分割精度,便捷实用。

Patent Agency Ranking