一种对抗和注意力机制引导的强化学习知识图谱推理方法及系统

    公开(公告)号:CN118606485A

    公开(公告)日:2024-09-06

    申请号:CN202410720573.5

    申请日:2024-06-05

    Inventor: 于艳华 蔡修秀

    Abstract: 本发明公开了一种对抗和注意力机制引导的强化学习知识图谱推理方法及系统,方法包括:构建知识图谱环境,使用知识图谱嵌入模型将知识图谱中的实体和关系进行状态编码;基于状态编码与查询的三元组关系进行计算,获得累计交互权重值,根据累计交互权重值对当前状态的工作空间进行修剪;智能体根据推理策略在每个状态下的空间动作中选择一个动作,同时使用LSTM对智能体的探索路径进行记录,将选择的动作返回给知识图谱环境,知识图谱环境更新状态,并根据当前状态判断是否到达预计目标节点;智能体通过与环境的交互学习最优的知识图谱推理策略,以最大化长期奖励。本发明提高了推理结果的可解释性,为推理模型的应用和理解提供了有力支持。

Patent Agency Ranking