一种基于语境化胶囊网络的生物医学实体识别方法

    公开(公告)号:CN110807327A

    公开(公告)日:2020-02-18

    申请号:CN201910982694.6

    申请日:2019-10-16

    Abstract: 本发明属于计算机自然语言处理技术领域,提供了一种基于语境化胶囊网络的生物医学实体识别方法,包括以下步骤:S1:获取生物医学相关语料;S2:对获取的相关文本进行数据预处理操作;S3:构建语境化胶囊网络的生物医学实体识别模型,并在训练集上进行训练;S4:利用训练好的语境化胶囊网络模型对未知的生物医学文本进行命名实体识别;S5:后处理操作,即在语境化胶囊网络模型预测的结果基础上设置所有的非法标签为“O”,进一步提高实体识别性能。本发明提出的方法实现了自动识别生物医学文献中的命名实体,较人工识别方式有更高的识别准确率和更少的时间开销,且有更强的泛化能力。

Patent Agency Ranking