-
公开(公告)号:CN108491375A
公开(公告)日:2018-09-04
申请号:CN201810173270.0
申请日:2018-03-02
Applicant: 复旦大学
IPC: G06F17/27
Abstract: 本发明公开了一种基于CN-DBpedia的实体识别与链接系统和方法。该系统包括实体链接模块和实体识别模块;实体链接模块包括同义词匹配单元和实体链接单元;实体识别模块包括分词器、词概率计算单元和实体判别单元。本发明构建了实体与词语的语义关系,从而能在极少的上下文中挖掘到与实体的关系。本发明将基于机器学习的实体识别算法与非监督的分词算法融合。能从全局性的角度考虑实体名划分的合理性,又扩展了分词的词表空间,以更加合理的算法计算实体词的成词概率。本发明先链接再识别,使得实体识别时充分利用到了文本的语义信息,实现更好的分词与实体识别。
-
公开(公告)号:CN118468872A
公开(公告)日:2024-08-09
申请号:CN202310086891.6
申请日:2023-02-09
Applicant: 复旦大学
IPC: G06F40/295 , G06F40/126 , G06N3/047 , G06N3/048 , G06N3/08 , G06N3/0442
Abstract: 本发明提供了一种基于分层强化学习的端到端实体链接方法,具有这样的特征,包括以下步骤:步骤S1构建结果集合;步骤S2输入文本编码得到高层状态;步骤S3由高层状态生成候选指代集合;步骤S4由高层策略得到高层动作若为候选指代进入步骤S5否则进入步骤S11;步骤S5将高层动作编码获得向量;步骤S6初始化i和单词序列;步骤S7由向量和单词序列得低层状态;步骤S8由低层策略得低层动作若为单词进入步骤S9否则进入步骤S10;步骤S9低层动作放入单词序列中i加1进入步骤S7;步骤S10候选指代和单词序列放入结果集合进入步骤S2;步骤S11结果集合作为实体链接结果。总之,本方法能够更加准确地对指代链接实体。
-
公开(公告)号:CN108491375B
公开(公告)日:2022-04-12
申请号:CN201810173270.0
申请日:2018-03-02
Applicant: 复旦大学
IPC: G06F40/295 , G06F40/30 , G06F40/247
Abstract: 本发明公开了一种基于CN‑DBpedia的实体识别与链接系统和方法。该系统包括实体链接模块和实体识别模块;实体链接模块包括同义词匹配单元和实体链接单元;实体识别模块包括分词器、词概率计算单元和实体判别单元。本发明构建了实体与词语的语义关系,从而能在极少的上下文中挖掘到与实体的关系。本发明将基于机器学习的实体识别算法与非监督的分词算法融合。能从全局性的角度考虑实体名划分的合理性,又扩展了分词的词表空间,以更加合理的算法计算实体词的成词概率。本发明先链接再识别,使得实体识别时充分利用到了文本的语义信息,实现更好的分词与实体识别。
-
-