-
公开(公告)号:CN115860104A
公开(公告)日:2023-03-28
申请号:CN202211386351.1
申请日:2022-11-07
Applicant: 哈尔滨工程大学
Abstract: 基于不确定性感知分层强化学习的迷宫导航策略学习方法,为了解决迷宫导航的分层强化学习训练阶段存在诸多不确定因素,导致分层强化学习的高层策略训练不稳定,使智能体决策准确率较低的问题,确定迷宫导航分层强化学习中影响高层策略训练稳定性的因素;获取迷宫导航的训练数据集;利用训练数据集对构建的动作不确定性估计网络进行训练,输入迷宫导航中智能体的状态和任务目标,输出伪子目标,得到训练好的动作不确定性估计网络;利用伪子目标约束分层强化学习高层策略的训练过程,得到子目标;利用子目标约束分层强化学习低层策略的训练过程,得到智能体的动作,计算低层策略的期望最大化平均奖励回报,回报值越大,迷宫导航策略学习越成功。
-
公开(公告)号:CN118333159A
公开(公告)日:2024-07-12
申请号:CN202410448614.X
申请日:2024-04-15
Applicant: 哈尔滨工程大学
Abstract: 基于图对比学习的知识图谱补全方法,本发明涉及知识图谱应用补全方法。本发明的目的是为了解决现有法律案情知识图谱不完善的问题。基于图对比学习的知识图谱补全方法具体过程为:步骤一、构建知识图谱;步骤二、获得知识图谱中每个实体的初始向量和关系的初始向量;步骤三、基于知识图谱中每个实体的初始向量,获得知识图谱中每个实体的最优向量;步骤四、计算知识图谱中实体向量之间的相似度;步骤五、基于相似度计算结果,预测并补全知识图谱中缺失的潜在关系;步骤六、将预测出的潜在关系添加到知识图谱中,更新知识图谱。本发明用于知识图谱领域。
-