-
公开(公告)号:CN116738992A
公开(公告)日:2023-09-12
申请号:CN202310038699.X
申请日:2023-01-12
Applicant: 重庆邮电大学
IPC: G06F40/295 , G06F40/284 , G06F40/30 , G06F16/35 , G06F18/2415 , G06F18/25 , G16H10/60 , G06N3/042 , G06N3/0442 , G06N3/045 , G06N3/084
Abstract: 本发明属于自然语言处理领域,具体涉及一种基于图注意力网络和字词融合的医疗命名实体识别方法,包括将待识别的文本序列输入Bert模型,得到文本序列中每一个文字的特征向量,即得到字特征;通过SoftLexicon方法将与文本序列中字符匹配的词汇表示层特征向量,即得到词汇特征;令字特征指向与之对应的词汇特征构建有向图,并利用邻接矩阵保存有向图的信息,将字特征、词汇特征及其对应的邻接矩阵利用图注意力网络进行融合,得到字词特征向量;利用BiLSTM网络对字词特征向量进行上下文语义提取,得到上下文语义向量;将上下文语义向量输入条件随机场层,预测得到文本序列对应的标签;本发明有效提高医疗命名实体识别的准确率。
-
公开(公告)号:CN116738992B
公开(公告)日:2024-09-24
申请号:CN202310038699.X
申请日:2023-01-12
Applicant: 重庆邮电大学
IPC: G06F40/295 , G06F40/284 , G06F40/30 , G06F16/35 , G06F18/2415 , G06F18/25 , G16H10/60 , G06N3/042 , G06N3/0442 , G06N3/045 , G06N3/084
Abstract: 本发明属于自然语言处理领域,具体涉及一种基于图注意力网络和字词融合的医疗命名实体识别方法,包括将待识别的文本序列输入Bert模型,得到文本序列中每一个文字的特征向量,即得到字特征;通过SoftLexicon方法将与文本序列中字符匹配的词汇表示层特征向量,即得到词汇特征;令字特征指向与之对应的词汇特征构建有向图,并利用邻接矩阵保存有向图的信息,将字特征、词汇特征及其对应的邻接矩阵利用图注意力网络进行融合,得到字词特征向量;利用BiLSTM网络对字词特征向量进行上下文语义提取,得到上下文语义向量;将上下文语义向量输入条件随机场层,预测得到文本序列对应的标签;本发明有效提高医疗命名实体识别的准确率。
-