面向中文短文本的实体识别与实体链接方法

    公开(公告)号:CN113377930A

    公开(公告)日:2021-09-10

    申请号:CN202110931275.7

    申请日:2021-08-13

    Abstract: 本发明提供面向中文短文本的实体识别与实体链接方法,包括:使用知识库中的实体名称与实体别名信息去构建实体名称词典并识别出实体;将实体的描述文本输入到预训练语言模型中,得到实体的名称嵌入表示;将所述识别出的实体在原始短文本中的位置特征、原始短文本和所述实体的名称嵌入表示同时输入到融合知识库实体名嵌入的短文本实体识别模型中,得到当前实体是否为正确实体的概率;再与传统的实体识别模型融合,得到最终实体识别结果;利用给定的知识库构建实体指称项词典,并通过实体识别结果确定每一个待消歧实体的候选实体集合;将原始短文本和待消歧实体的描述文本连在一起,输入实体链接模型,得到正确的链接实体。

    面向中文短文本的实体识别与实体链接方法

    公开(公告)号:CN113377930B

    公开(公告)日:2021-11-30

    申请号:CN202110931275.7

    申请日:2021-08-13

    Abstract: 本发明提供面向中文短文本的实体识别与实体链接方法,包括:使用知识库中的实体名称与实体别名信息去构建实体名称词典并识别出实体;将实体的描述文本输入到预训练语言模型中,得到实体的名称嵌入表示;将所述识别出的实体在原始短文本中的位置特征、原始短文本和所述实体的名称嵌入表示同时输入到融合知识库实体名嵌入的短文本实体识别模型中,得到当前实体是否为正确实体的概率;再与传统的实体识别模型融合,得到最终实体识别结果;利用给定的知识库构建实体指称项词典,并通过实体识别结果确定每一个待消歧实体的候选实体集合;将原始短文本和待消歧实体的描述文本连在一起,输入实体链接模型,得到正确的链接实体。

Patent Agency Ranking