-
公开(公告)号:CN116757190B
公开(公告)日:2023-10-20
申请号:CN202311022054.3
申请日:2023-08-15
IPC: G06F40/279 , G06F40/30 , G06N3/0442
Abstract: 本发明涉及智能医疗领域的知识图谱的自动化构建,更具体地,涉及一种基于双向树型标注方法的实体关系联合抽取方法。包括:获取待预测文本;将所述待预测文本中的关系与预定义关系类型集合匹配;当匹配结果为是时,将所述待预测文本输入全监督模块中,得到待预测文本中的每个词的标注序列;当匹配结果为否时,将所述待预测文本和少量对应关系的标注样本分别输入小样本模块中,得到待预测文本中的每个词的标注序列;基于所述待预测文本中的每个词的标注序列还原出待预测文本的关系结构图,并抽取关系结构图中的三元组集合。本申请在不增加过多标注数量和时间开销的情况下,提高抽取的准确率和召回率。
-
公开(公告)号:CN116757190A
公开(公告)日:2023-09-15
申请号:CN202311022054.3
申请日:2023-08-15
IPC: G06F40/279 , G06F40/30 , G06N3/0442
Abstract: 本发明涉及智能医疗领域的知识图谱的自动化构建,更具体地,涉及一种基于双向树型标注方法的实体关系联合抽取方法、系统及设备。包括:获取待预测文本;将所述待预测文本中的关系与预定义关系类型集合匹配;当匹配结果为是时,将所述待预测文本输入全监督模块中,得到待预测文本中的每个词的标注序列;当匹配结果为否时,将所述待预测文本和少量对应关系的标注样本分别输入小样本模块中,得到待预测文本中的每个词的标注序列;基于所述待预测文本中的每个词的标注序列还原出待预测文本的关系结构图,并抽取关系结构图中的三元组集合。本申请在不增加过多标注数量和时间开销的情况下,提高抽取的准确率和召回率。
-