基于ALBERT模型融合的医疗命名实体识别系统及其方法

    公开(公告)号:CN113971405A

    公开(公告)日:2022-01-25

    申请号:CN202111452052.9

    申请日:2021-12-01

    Abstract: 本发明涉及基于ALBERT模型融合的医疗命名实体识别系统及方法,数据预处理模块,对用户问句分词、实体标注、词典构建;文本编码模块,将文本转化为可理解的数据类型和计算单元;模型建模模块,根据任务构建模型的框架;实体提取模块,对经过构建模型的运算已经特征提取之后的信息进行实体提取并进行分类;词典构建模块,构建医疗病历的命名实体语料词典。将电子医疗病历文本进行数据预处理,中文分词模块对文本进行分词,实体标注模块对文本进行标注,再对一些错误和无用的数据进行剔除;对电子病历进行数据清洗,有效减少模型训练时间成本;新型的模型融合模式,解决医疗领域的电子病历领域命名实体识别问题,有更高的实体识别准确率。

Patent Agency Ranking