-
公开(公告)号:CN115269876A
公开(公告)日:2022-11-01
申请号:CN202210931975.0
申请日:2022-08-04
Applicant: 苏州大学
IPC: G06F16/36 , G06F40/295 , G06N3/04 , G06N3/08
Abstract: 本申请涉及自然语言处理技术领域,公开了一种化学物与蛋白质作用关系的抽取方法,包括:获取文本中的化学物实体集合、蛋白质实体集合、以及若干个问题模板;从化学物实体集合中选取一个化学物实体作为目标化学物实体,将目标化学物实体输入每个问题模板中;利用包含目标化学物实体的问题模板对文本进行询问,抽取文本中与目标化学物实体存在作用关系的目标蛋白质实体以得到关系组。当一段文本中的化学物实体和蛋白质实体数量较多时,本申请通过问答的形式从文本中抽取化学物‑蛋白质作用关系,可以克服化学物实体和蛋白质实体两两配对所带来的实体对数量众多的缺点,有效提高化学物‑蛋白质作用关系的抽取效率。
-
公开(公告)号:CN107992476B
公开(公告)日:2020-11-24
申请号:CN201711216700.4
申请日:2017-11-28
Applicant: 苏州大学
IPC: G06F40/211 , G06F40/295
Abstract: 本发明涉及一种面向句子级的生物关系网络抽取的语料库生成方法及系统,为了实现机器学习自动完成文本整个标注过程而设计。本发明的方法,包括:对文本句子进行实体识别和映射;生成依存句法树,从依存句法树中抽取出包含语句中所有实体的最小子树,按照结点在文本句子中的词序恢复出对应的词语序列,该词语序列为最短词语序列;对树形结构进行前序遍历,得到结点序列;分析词语序列中的词和结点序列中的实体、功能和关系之间的对应关系,对最短词序列进行标注,生成关系网络标注语料。本发明操作方法简单,极大地节省了人力物力,并能够推广到其他领域的关系网络抽取任务中。
-
公开(公告)号:CN107992476A
公开(公告)日:2018-05-04
申请号:CN201711216700.4
申请日:2017-11-28
Applicant: 苏州大学
IPC: G06F17/27
Abstract: 本发明涉及一种面向句子级的生物关系网络抽取的语料库生成方法及系统,为了实现机器学习自动完成文本整个标注过程而设计。本发明的方法,包括:对文本句子进行实体识别和映射;生成依存句法树,从依存句法树中抽取出包含语句中所有实体的最小子树,按照结点在文本句子中的词序恢复出对应的词语序列,该词语序列为最短词语序列;对树形结构进行前序遍历,得到结点序列;分析词语序列中的词和结点序列中的实体、功能和关系之间的对应关系,对最短词序列进行标注,生成关系网络标注语料。本发明操作方法简单,极大地节省了人力物力,并能够推广到其他领域的关系网络抽取任务中。
-
公开(公告)号:CN104182535B
公开(公告)日:2017-05-24
申请号:CN201410436852.5
申请日:2014-08-29
Applicant: 苏州大学
Abstract: 本申请公开了一种人物关系抽取方法和装置,该方法包括:确定待抽取的人物关系的基本模式,对人物关系的基本模式进行人称代词的泛化得到泛化模式;在语料库中匹配满足泛化模式的人物关系;在指代消解范围内确定泛化模式中的人称代词所指向的第一人名;抽取该第一人名及对应的泛化模式的人物关系后端的第二人名,得到第一人名和第二人名的人物关系。通过采用上述泛化基本模式的人物关系中前端的人名,然后依据该泛化模式在语料库中进行匹配将得到以泛化模式存在的待抽取的人物关系,使得在面对海量文本资源时,不仅限于基本模式的人物关系的抽取,满足泛化模式的人物关系也可以被抽取出来,大大提高了人物关系的抽取效率。
-
-
公开(公告)号:CN103150405A
公开(公告)日:2013-06-12
申请号:CN201310108506.X
申请日:2013-03-29
Applicant: 苏州大学
Abstract: 本申请提供一种分类模型建模方法、中文跨文本指代消解方法和系统。其中一种分类模型建模方法,包括:获取训练文本集;从训练文本集中选取实体表述对;获取每个实体表述对的特征项;选取正训练实例和负训练实例,将每个正训练实例和每个负训练实例的特征项分别加载到支持向量机的建模工具中,得到分类模型。对于待识别文本集中的实体表述对,在提取特征项后,可以使用分类模型判断是否具有指代关系,然后合并具有指代关系的实体表述对,构成跨文本指代链,从而达到跨文本指代消解的目的。由于上述方案获取的语义特征可以充分利用各种外部语义资源,挖掘实体表述对所具有的实际含义,从而提高分类模型及跨文本指代消解系统的准确度。
-
-
-
-
-