一种基于强化学习的环境建模方法

    公开(公告)号:CN116579231A

    公开(公告)日:2023-08-11

    申请号:CN202310366576.9

    申请日:2023-04-07

    Abstract: 本发明公开了一种基于强化学习的环境建模方法,旨在通过Model‑basedRL技术,将仿真环境进行建模并存储,旨在降低多智能体强化学习任务中的学习复杂度,进而提升后续多智能体强化学习算法高效求解模块的效率。包括仿真场景选择功能,仿真环境建模功能,环境模型存储功能。仿真场景选择功能包括应急管理、金融期货、交通控制仿真场景选择接入;仿真环境建模功能基于两种模式,即人工辅助模式或智能模式来针对不同的情况对仿真环境建模;环境模型存储功能将上述建模完毕的模型存储到相应的位置以供后续调用,以提升多智能体强化学习算法的学习效率。

    基于自适应策略调整的卡牌类游戏深度学习训练方法及系统

    公开(公告)号:CN118657189A

    公开(公告)日:2024-09-17

    申请号:CN202410614584.5

    申请日:2024-05-17

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于自适应策略调整的卡牌类游戏深度学习训练方法及系统,包括如下步骤:采用价值神经网络构建卡牌类游戏的策略基本模型;获取卡牌类游戏的经验知识;建立自适应经验知识融合正则项计算规则;建立自适应状态动作约简损失计算规则;对所述策略基本模型通过自博弈的方式采样,并使用包括自博弈损失和自适应策略调整损失的总损失函数和梯度下降法进行模型参数更新,完成训练;其中,所述自适应策略调整损失包括自适应经验知识融合正则项和自适应状态动作约简损失。本发明训练速度更快。

    小分子化合物双水杨酸酯在制备治疗非酒精性脂肪肝病药物中的应用

    公开(公告)号:CN112107585A

    公开(公告)日:2020-12-22

    申请号:CN202011210283.4

    申请日:2020-11-03

    Applicant: 南京大学

    Abstract: 本发明属于医药生物技术领域,具体涉及一种小分子化合物双水杨酸酯在制备治疗非酒精性脂肪肝病药物中的应用。本发明通过体外酶活试验筛选,发现水杨酸类化合物具有直接激活AMPK酶活性的作用,包括 双水杨酸酯(PubChem CID 5161)及药学上可接受的盐。这些化合物均能增加AMPK酶活性。进一步研究发现这些化合物可以在动物体内激活AMPK。可以逆转脂肪肝中AMPK活性抑制状态,降低肝脏脂肪堆积,在制备治疗非酒精性脂肪肝病药物中应用。

Patent Agency Ranking