-
公开(公告)号:CN116822514A
公开(公告)日:2023-09-29
申请号:CN202310678143.7
申请日:2023-06-08
Applicant: 上海核工程研究设计院股份有限公司
IPC: G06F40/295 , G06F16/35 , G06F40/30
Abstract: 本公开提供了一种文本数据实体关系联合抽取方法及系统,涉及文本数据处理领域,方法包括获取待抽取的文本语句,对文本语句转换为离散文本序列,再将文本序列划分为连续的分词,将一段连续的分词作为一个集合,该集合为一个片段;以片段作为基本单位,先通过枚举,获取所有可能出现的实体,采用注意力机制提取语义特征之后进行类别判断,获取实体识别的结果;提取片段的语义特征向量,将实体识别的结果与语义特征向量进行拼接,经过全连接层后得到实体向量,再进行一次拼接得到关系矩阵,最后通过激活函数计算出实体在各个关系类别上的分布概率,由此获取实体关系的分类。