-
公开(公告)号:CN119807391A
公开(公告)日:2025-04-11
申请号:CN202411665523.8
申请日:2024-11-20
Applicant: 北京科技大学
IPC: G06F16/334 , G06F16/3329 , G06F16/36 , G06F40/30 , G06F18/22 , G06N5/022 , G06N3/0455 , G06N3/048 , G06N5/04
Abstract: 本发明提供一种基于大语言模型的中文实体链接方法及系统,涉及自然语言处理技术领域,方法包括:构建知识库并将每个实体转化为实体向量,接收中文输入文本,利用大语言模型识别待链接实体,并生成相应的描述文本;通过召回词实体检索方法,生成第一候选实体集;基于描述文本及向量相似度,生成第二候选实体集;交叉比对两者,若只有一个相同的目标实体,利用BERT模型评分,若评分高于第一预设值,则作为第一实体链接结果;若没有或有多个相同实体,则利用BERT模型对两个候选集进行评分,挑选评分高于第二预设值的多个实体,选择得分最高的实体作为第二实体链接结果;利用大语言模型,过滤实体链接结果中错误的实体链接结果。