-
公开(公告)号:CN108830321A
公开(公告)日:2018-11-16
申请号:CN201810618637.5
申请日:2018-06-15
Applicant: 中南大学
IPC: G06K9/62
CPC classification number: G06K9/6267 , G06K9/6256
Abstract: 本发明公开了一种不平衡数据集的分类方法,包括获取训练数据并得到训练数据的候选频繁项集;对候选频繁项集进行过滤;将候选关联规则分类至规则集合中;衡量规则前件和后件的相关性得到分类关联规则;对得到的分类关联规则进行过滤和排序从而得到分类器;采用分类器对不平衡数据进行分类。本发明方法结合了增比置信度、负关联规则挖掘、增比率和规则强度定义,通过多种因素的结合,能更全面的衡量规则的优先级,因此本发明方法能够在不平衡数据集中有很好的分类效果,在保证整体分类效果的情况下,能够有效提高分类效果,而且本发明方法简单可靠。
-
公开(公告)号:CN108806767B
公开(公告)日:2021-10-22
申请号:CN201810619124.6
申请日:2018-06-15
Applicant: 中南大学
IPC: G16H10/60 , G16H50/70 , G06F16/28 , G06F16/2455
Abstract: 本发明公开了一种基于电子病历的疾病症状关联分析方法,包括获取电子病历的数据并处理;构建不平衡数据集的分类器;采用分类器对疾病症状进行关联分析。本发明通过对电子病历进行处理获取基础数据,然后根据基础数据构造相应的新型不平衡数据集的分类器,再利用该分类器进行疾病与症状的关联分析,因此本发明方法能够对疾病症状进行较为准确的关联,而且方法简答、科学和可靠。
-
公开(公告)号:CN108806767A
公开(公告)日:2018-11-13
申请号:CN201810619124.6
申请日:2018-06-15
Applicant: 中南大学
Abstract: 本发明公开了一种基于电子病历的疾病症状关联分析方法,包括获取电子病历的数据并处理;构建不平衡数据集的分类器;采用分类器对疾病症状进行关联分析。本发明通过对电子病历进行处理获取基础数据,然后根据基础数据构造相应的新型不平衡数据集的分类器,再利用该分类器进行疾病与症状的关联分析,因此本发明方法能够对疾病症状进行较为准确的关联,而且方法简答、科学和可靠。
-
公开(公告)号:CN107527073B
公开(公告)日:2021-02-26
申请号:CN201710789885.1
申请日:2017-09-05
Applicant: 中南大学
Abstract: 本发明公开了一种电子病历中命名实体的识别方法,包括构建电子病历的专业领域词典;将电子病历中的文本分类;对包含命名实体的文本进行实体标注,同时将标注后的文本作为训练集,未标注的文本作为测试集;初步设定条件随机场模型中的特征模板窗口的大小和特征模板内容,并对测试集进行测试;迭代调整特征模板窗口的大小和特征模板内容,直至得到最终的特征模板窗口的大小和特征模板内容;采用条件随机场模型对所有的电子病历进行命名实体的识别。本发明方法能够自动识别电子病历的命名实体,大大提高了识别效率,而且能够不断改善条件随机场模型的精度和模型识别度,能够更加精确和快速的进行实体识别。
-
公开(公告)号:CN107527073A
公开(公告)日:2017-12-29
申请号:CN201710789885.1
申请日:2017-09-05
Applicant: 中南大学
Abstract: 本发明公开了一种电子病历中命名实体的识别方法,包括构建电子病历的专业领域词典;将电子病历中的文本分类;对包含命名实体的文本进行实体标注,同时将标注后的文本作为训练集,未标注的文本作为测试集;初步设定条件随机场模型中的特征模板窗口的大小和特征模板内容,并对测试集进行测试;迭代调整特征模板窗口的大小和特征模板内容,直至得到最终的特征模板窗口的大小和特征模板内容;采用条件随机场模型对所有的电子病历进行命名实体的识别。本发明方法能够自动识别电子病历的命名实体,大大提高了识别效率,而且能够不断改善条件随机场模型的精度和模型识别度,能够更加精确和快速的进行实体识别。
-
-
-
-