-
公开(公告)号:CN112287665B
公开(公告)日:2024-05-03
申请号:CN202011116445.8
申请日:2020-10-19
Applicant: 南京南邮信息产业技术研究院有限公司 , 南京邮电大学
IPC: G06F40/216 , G06F18/214 , G06N3/0464 , G06N3/049 , G06N3/08
Abstract: 本发明公开了基于自然语言处理和集成训练的慢病数据分析方法及系统,系统包括数据预处理模块、数据识别模块、数据训练模块和数据可视化模块,数据预处理模块从外部的慢病数据库提取慢病数据生成对应的词向量,再将词向量量化作为训练样本;数据识别模块将训练样本的词向量输入到双向长短期记忆网络进行训练,得到隐藏向量并传送到条件概率场以计算字符标签;数据训练模块进行分类训练以提取慢病症状、生化病理指标和治疗间的三元关联模型,传送到数据可视化模块进行统计分析及传送到外部的用户界面模块呈现。从而达到充分利用大量的非结构化电子医疗数据、结合自然语言处理和集成训练神经网络来进行慢性病的成因分析、病情预测,从而对症下药。