-
公开(公告)号:CN114461747A
公开(公告)日:2022-05-10
申请号:CN202210049778.6
申请日:2022-01-17
Applicant: 中国科学院信息工程研究所
IPC: G06F16/31 , G06F40/279 , G06N3/04 , G06N3/08 , G06N5/02
Abstract: 本发明公开了一种基于标签图抑制噪声数据影响的远程监督关系抽取方法及装置,包括基于实体对的原始标签,构建标签图;生成所述标签图的标签表示矩阵;收集包含目标实体对的句子sj,得到句子包;结合所述目标实体对在每一句子j中的位置与目标实体对的向量表示,计算每一句子sj的句子表示oj;计算所述标签l对于所述句子表示oj的权重αlj;对所述句子表示oj进行加权求和,得到所述句子包在所述标签l下的句子包表示bl;计算句子包表示bl在标签l下的分数gl;拼接所述分数gl,并基于得到的基本标签的分数向量gb,获取所述目标实体对的原始标签。本发明更好地解决了远程监督关系抽取任务中噪声数据影响模型训练的问题。
-
公开(公告)号:CN114461747B
公开(公告)日:2024-11-01
申请号:CN202210049778.6
申请日:2022-01-17
Applicant: 中国科学院信息工程研究所
IPC: G06F16/31 , G06F40/279 , G06N3/042 , G06N3/048 , G06N5/02 , G06N3/045 , G06N3/0464 , G06N3/0442 , G06N3/09
Abstract: 本发明公开了一种基于标签图抑制噪声数据影响的远程监督关系抽取方法及装置,包括基于实体对的原始标签,构建标签图;生成所述标签图的标签表示矩阵;收集包含目标实体对的句子sj,得到句子包;结合所述目标实体对在每一句子j中的位置与目标实体对的向量表示,计算每一句子sj的句子表示oj;计算所述标签l对于所述句子表示oj的权重αlj;对所述句子表示oj进行加权求和,得到所述句子包在所述标签l下的句子包表示bl;计算句子包表示bl在标签l下的分数gl;拼接所述分数gl,并基于得到的基本标签的分数向量gb,获取所述目标实体对的原始标签。本发明更好地解决了远程监督关系抽取任务中噪声数据影响模型训练的问题。
-