-
公开(公告)号:CN120031035A
公开(公告)日:2025-05-23
申请号:CN202411926197.1
申请日:2024-12-25
Applicant: 中国人民解放军总医院第四医学中心
IPC: G06F40/295 , G06F40/30 , G06F40/284 , G06F16/35 , G06F18/24 , G06N3/0442 , G06N3/049 , G06N3/048 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于多特征融合的中文医学命名实体识别方法及装置,涉及中文医学自然语言处理技术领域。方法包括:获取待识别的中文医学文本以及中文医学命名实体识别模型;基于中文医学文本以及嵌入层,得到中文医学文本的词嵌入;基于中文医学文本的词嵌入以及特征提取层,得到中文医学文本的上下文特征和局部特征;基于中文医学文本的上下文特征和局部特征以及特征融合层,得到融合后的特征;基于融合后的特征以及标注层,得到中文医学文本相应的命名实体并进行分类,完成中文医学命名实体的识别。采用本发明,解决了中文医学文本中存在的上下文依赖关系过于复杂、实体边界模糊的问题,降低了算法的时间复杂度,提高了模型的推理速度。