-
公开(公告)号:CN109509557A
公开(公告)日:2019-03-22
申请号:CN201811363273.7
申请日:2018-11-16
Applicant: 郑州大学第一附属医院
Abstract: 本发明公开了一种基于大数据平台的中文电子病历信息抽取预处理方法,属于大数据技术领域,通过对非结构化的电子病历进行预处理,使用文本分割,判定非结构化的电子病历所属类别,并根据不同的类别再次分解为部分,最终形成按照业务逻辑分解为HIVE表字段的分区表;根据不同标注设计,分别输出预标注语料,解决了快速方便的进行语料标注的技术问题,本发明通过合理设计的信息预处理,利用大数据技术,能够极大提高语料标注的效率。
-
公开(公告)号:CN109509557B
公开(公告)日:2021-07-27
申请号:CN201811363273.7
申请日:2018-11-16
Applicant: 郑州大学第一附属医院
IPC: G16H50/70 , G06F16/35 , G06F40/289 , G06F40/30
Abstract: 本发明公开了一种基于大数据平台的中文电子病历信息抽取预处理方法,属于大数据技术领域,通过对非结构化的电子病历进行预处理,使用文本分割,判定非结构化的电子病历所属类别,并根据不同的类别再次分解为部分,最终形成按照业务逻辑分解为HIVE表字段的分区表;根据不同标注设计,分别输出预标注语料,解决了快速方便的进行语料标注的技术问题,本发明通过合理设计的信息预处理,利用大数据技术,能够极大提高语料标注的效率。
-