基于大规模预训练语言模型的因果医学知识图谱构建方法

    公开(公告)号:CN117668245A

    公开(公告)日:2024-03-08

    申请号:CN202311590410.1

    申请日:2023-11-27

    Abstract: 为解决人工标注成本高和传统知识图谱技术对多跳问题推理准确度低的技术问题,本发明提出一种基于大规模预训练语言模型的因果关系医学知识图谱构建方法,首先构建一些人工标注的包含{文本,关系,解释}训练实例,来训练大规模预训练语言模型,然后将这些训练实例排除在外,让模型生成其他未经人工标注的实例的CoT(思维链)解释并生成关系,然后将这些生成的{文本,关系,CoT解释}实例送入T5进行微调训练,最后将大量未标记的医学文本送入T5获得文本中的关系,基于这些关系来构建医疗知识图谱。

Patent Agency Ranking