一种基于大语言模型的中文实体链接方法及系统

    公开(公告)号:CN119807391A

    公开(公告)日:2025-04-11

    申请号:CN202411665523.8

    申请日:2024-11-20

    Abstract: 本发明提供一种基于大语言模型的中文实体链接方法及系统,涉及自然语言处理技术领域,方法包括:构建知识库并将每个实体转化为实体向量,接收中文输入文本,利用大语言模型识别待链接实体,并生成相应的描述文本;通过召回词实体检索方法,生成第一候选实体集;基于描述文本及向量相似度,生成第二候选实体集;交叉比对两者,若只有一个相同的目标实体,利用BERT模型评分,若评分高于第一预设值,则作为第一实体链接结果;若没有或有多个相同实体,则利用BERT模型对两个候选集进行评分,挑选评分高于第二预设值的多个实体,选择得分最高的实体作为第二实体链接结果;利用大语言模型,过滤实体链接结果中错误的实体链接结果。

Patent Agency Ranking