-
公开(公告)号:CN109871538A
公开(公告)日:2019-06-11
申请号:CN201910119391.1
申请日:2019-02-18
Applicant: 华南理工大学
IPC: G06F17/27
Abstract: 本发明公开了一种中文电子病历命名实体识别方法,包括步骤:1)构建普通词汇字典;2)简约词性标注;3)构建文本和词性向量映射表;4)训练命名实体的预测模型;5)命名实体的标签预测。本发明通过加入词性特征,来提高命名实体和普通词汇的边界可区分性,从而提高命名实体边界准确率。同时,在双向的LSTM-CRF模型中引入自注意力机制,计算每个时刻输入与句子中其他成分的相关度,从而缓解长依赖问题,提高命名实体识别准确率。