-
公开(公告)号:CN117610573A
公开(公告)日:2024-02-27
申请号:CN202311640997.2
申请日:2023-11-30
Applicant: 中国舰船研究设计中心
IPC: G06F40/295 , G06F16/901 , G06F16/903 , G06F40/126 , G06F40/279 , G06N5/02 , G06N3/0455 , G06N3/048 , G06N3/047
Abstract: 本发明公开了一种基于实体链接表的实体识别方法,包括以下步骤:1)获取知识库中的非结构化、半结构化和结构化数据在内的多种数据源;2)整合异构数据源,对于整合后的实体名称,中文名称按字切分,英文名称按词切分,并且根据切分的结果生成ac树、倒排表、tfidf的权重以及实体链接表;3)对输入文本序列信息进行处理;4)使用实体链接表PromptIE模型对不同数据源的文本进行统一编码,对句子中已匹配的实体与句子进行实体识别,抽取实体知识。本发明方法可以从多种数据来源进行实体识别,而无需针对某种数据类型修改模型。