基于三元损失训练策略的生物医学实体关系抽取方法

    公开(公告)号:CN114238561B

    公开(公告)日:2024-08-13

    申请号:CN202111455875.7

    申请日:2021-12-01

    Abstract: 本发明公开了一种基于三元损失训练策略的生物医学实体关系抽取方法,该方法主要包括:三元数据生成,句子级特征和实体级特征提取,关系分类。首先使用三元数据生成规则得到合法的三元数据;之后使用基于Bert的神经网络模型抽取每个实例的句子级特征和实体级特征;接着基于句子级和实体级特征向量计算模型三元损失进行模型训练;在训练结束后可以直接使用模型得到的特征向量进行关系分类,从而得到实体对关系类别。本发明能够避免将“来自同一个句子但属于不同类别”的实例错分为同一类的情况,更好的提升关系分类的准确率。

    基于三元损失训练策略的生物医学实体关系抽取方法

    公开(公告)号:CN114238561A

    公开(公告)日:2022-03-25

    申请号:CN202111455875.7

    申请日:2021-12-01

    Abstract: 本发明公开了一种基于三元损失训练策略的生物医学实体关系抽取方法,该方法主要包括:三元数据生成,句子级特征和实体级特征提取,关系分类。首先使用三元数据生成规则得到合法的三元数据;之后使用基于Bert的神经网络模型抽取每个实例的句子级特征和实体级特征;接着基于句子级和实体级特征向量计算模型三元损失进行模型训练;在训练结束后可以直接使用模型得到的特征向量进行关系分类,从而得到实体对关系类别。本发明能够避免将“来自同一个句子但属于不同类别”的实例错分为同一类的情况,更好的提升关系分类的准确率。

Patent Agency Ranking