-
公开(公告)号:CN114171147A
公开(公告)日:2022-03-11
申请号:CN202111446280.5
申请日:2021-11-30
Applicant: 中国医学科学院北京协和医院 , 北京安妮福克斯信息咨询有限公司
IPC: G16H10/60 , G06N3/08 , G06N3/04 , G06F40/295 , G06F40/289
Abstract: 本发明提供一种新型医疗文本预处理系统,其特征在于,包括:文本数据;文本预处理,文本预处理的输出端单向连接于文本数据的输入端,文本预处理的输出端单向连接有mord2vec模型生成词向量,mord2vec模型生成词向量的输出端单向连接有堆叠BILSTM模型捕捉上下语境特征,所述堆叠BILSTM模型捕捉上下语境特征的输出端单向连接有CRF模型提取全局最优序列,所述CRF模型提取全局最优序列的输出端单向连接有输出预测命名实体识别序列,S1:所述文本预处理对输入的妊娠糖尿病电子病历文本进行分词。本发明提供的一种新型医疗文本预处理系统,可以获取到包含更丰富、更精准特征信息的文本表示,使得妊娠糖尿病电子病历的命名实体识别效果更加精准。
-
公开(公告)号:CN115238693A
公开(公告)日:2022-10-25
申请号:CN202210809038.8
申请日:2022-07-11
Applicant: 中国医学科学院北京协和医院 , 北京安妮福克斯信息咨询有限公司
IPC: G06F40/295 , G06F40/284 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于多分词和多层双向长短期记忆的中文命名实体识别方法,通过对BERT‑BILSTM‑CRF模型的修改,提高命名实体的识别精度;确定命名实体识别模型的输入与输出:以医疗文本为研究对象,将带有实体标注的医疗文本数据集作为命名实体识别模型的输入,模型的输出是对数据集进行医疗实体预测后给出的实体标注结果;本发明,通过进一步强化模型的文本的语境特征提取性能,一方面考虑了多词切分的方法来增加局部语境特征,另一方面引入了多层双向长短期记忆方法,通过设置不同深度的BILSTM模型来增加全局语境特征以及引入了医学词典这一外部知识,通过丰富模型学习过程中的语义特征信息,从而进一步提升命名实体识别任务的精度。
-
公开(公告)号:CN115169348A
公开(公告)日:2022-10-11
申请号:CN202210726176.X
申请日:2022-06-24
Applicant: 中国医学科学院北京协和医院 , 北京安妮福克斯信息咨询有限公司
IPC: G06F40/295 , G06F40/30 , G06F16/35 , G06N3/04
Abstract: 本发明公开了一种基于混合神经网络的事件抽取方法,具体涉及自然语言文本处理技术领域,包括步骤一:对原始文本进行数据预处理,并对原始文本进行分句,得到事件句,再对事件句进行分词、命名体识别,并将事件句序列转换为词向量的形式;步骤二:将以词向量表示的事件句序列传入到双向长短时记忆网络,即(前向和后向两个子LSTM网络),再利用BERT模型来捕捉字级别的语义特征。本发明利用BERT模型来解决一词多义的问题,且充分考虑了卷积神经网络有效提取文本局部特征与BILSTM网络提取文本全局特征的优势,以及文本在上下文语义中的信息,有效提取了文本的特征。模糊上下文语义的情况被解决,提高了事件抽取的效果。
-
公开(公告)号:CN120015375A
公开(公告)日:2025-05-16
申请号:CN202510093113.9
申请日:2025-01-21
Applicant: 中国医学科学院北京协和医院
Abstract: 本发明公开了一种患者院外病情、饮食生活信息共享系统,涉及饮食管理技术领域,包括:交互层、核心业务层,核心业务层包括健康服务随访管理模块、算法模块与运营支撑业务模块,交互层、健康服务随访管理模块与算法模块依次双向连接;交互层实现医生与患者的线上交互;健康服务随访管理模块用于记录患者饮食数据与健康数据生成健康日记,基于健康日记生成文字点评;算法模块基于饮食数据计算营养摄入生成营养摄入报告;运营支撑业务模块用于管理交互层不同用户的系统访问权限并管理随访计划。本发明使得患者的院外随访成为可能,诸如每日膳食、症状自我评估等信息均可以实时记录,并被临床医生掌握。
-
-
-