不平衡数据集的分类方法

    公开(公告)号:CN108830321A

    公开(公告)日:2018-11-16

    申请号:CN201810618637.5

    申请日:2018-06-15

    Applicant: 中南大学

    CPC classification number: G06K9/6267 G06K9/6256

    Abstract: 本发明公开了一种不平衡数据集的分类方法,包括获取训练数据并得到训练数据的候选频繁项集;对候选频繁项集进行过滤;将候选关联规则分类至规则集合中;衡量规则前件和后件的相关性得到分类关联规则;对得到的分类关联规则进行过滤和排序从而得到分类器;采用分类器对不平衡数据进行分类。本发明方法结合了增比置信度、负关联规则挖掘、增比率和规则强度定义,通过多种因素的结合,能更全面的衡量规则的优先级,因此本发明方法能够在不平衡数据集中有很好的分类效果,在保证整体分类效果的情况下,能够有效提高分类效果,而且本发明方法简单可靠。

    基于电子病历的疾病症状关联分析方法

    公开(公告)号:CN108806767B

    公开(公告)日:2021-10-22

    申请号:CN201810619124.6

    申请日:2018-06-15

    Applicant: 中南大学

    Abstract: 本发明公开了一种基于电子病历的疾病症状关联分析方法,包括获取电子病历的数据并处理;构建不平衡数据集的分类器;采用分类器对疾病症状进行关联分析。本发明通过对电子病历进行处理获取基础数据,然后根据基础数据构造相应的新型不平衡数据集的分类器,再利用该分类器进行疾病与症状的关联分析,因此本发明方法能够对疾病症状进行较为准确的关联,而且方法简答、科学和可靠。

    基于电子病历的疾病症状关联分析方法

    公开(公告)号:CN108806767A

    公开(公告)日:2018-11-13

    申请号:CN201810619124.6

    申请日:2018-06-15

    Applicant: 中南大学

    CPC classification number: G16H10/60 G16H50/70

    Abstract: 本发明公开了一种基于电子病历的疾病症状关联分析方法,包括获取电子病历的数据并处理;构建不平衡数据集的分类器;采用分类器对疾病症状进行关联分析。本发明通过对电子病历进行处理获取基础数据,然后根据基础数据构造相应的新型不平衡数据集的分类器,再利用该分类器进行疾病与症状的关联分析,因此本发明方法能够对疾病症状进行较为准确的关联,而且方法简答、科学和可靠。

    电子病历中命名实体的识别方法

    公开(公告)号:CN107527073B

    公开(公告)日:2021-02-26

    申请号:CN201710789885.1

    申请日:2017-09-05

    Applicant: 中南大学

    Abstract: 本发明公开了一种电子病历中命名实体的识别方法,包括构建电子病历的专业领域词典;将电子病历中的文本分类;对包含命名实体的文本进行实体标注,同时将标注后的文本作为训练集,未标注的文本作为测试集;初步设定条件随机场模型中的特征模板窗口的大小和特征模板内容,并对测试集进行测试;迭代调整特征模板窗口的大小和特征模板内容,直至得到最终的特征模板窗口的大小和特征模板内容;采用条件随机场模型对所有的电子病历进行命名实体的识别。本发明方法能够自动识别电子病历的命名实体,大大提高了识别效率,而且能够不断改善条件随机场模型的精度和模型识别度,能够更加精确和快速的进行实体识别。

    电子病历中命名实体的识别方法

    公开(公告)号:CN107527073A

    公开(公告)日:2017-12-29

    申请号:CN201710789885.1

    申请日:2017-09-05

    Applicant: 中南大学

    Abstract: 本发明公开了一种电子病历中命名实体的识别方法,包括构建电子病历的专业领域词典;将电子病历中的文本分类;对包含命名实体的文本进行实体标注,同时将标注后的文本作为训练集,未标注的文本作为测试集;初步设定条件随机场模型中的特征模板窗口的大小和特征模板内容,并对测试集进行测试;迭代调整特征模板窗口的大小和特征模板内容,直至得到最终的特征模板窗口的大小和特征模板内容;采用条件随机场模型对所有的电子病历进行命名实体的识别。本发明方法能够自动识别电子病历的命名实体,大大提高了识别效率,而且能够不断改善条件随机场模型的精度和模型识别度,能够更加精确和快速的进行实体识别。

Patent Agency Ranking