-
公开(公告)号:CN112802555A
公开(公告)日:2021-05-14
申请号:CN202110147526.2
申请日:2021-02-03
Applicant: 南开大学
Abstract: 本发明提出一种基于多变量AUC的特征选择方法,从癌症的差异表达数据中选择最互补的基因子集,实现全局分类性能最大化。本发明首先基于特征的可能误分类集提出一种AUC计算的新角度;然后对于一个特征集,确定其共同可能误分类集并计算每个特征组合后的新AUC;一个特征的新AUC与原始AUC的差值展示了组合后特征集中的其他特征对该特征分类能力的互补作用。最后基于特征组合后的新AUC计算mvAUC,并增量式的选择使当前mvAUC最大化的候选特征加入被选特征子集。本发明方法具有可以直接评估被选特征子集的全局类辨别能力的优点,不需要成对地计算候选特征和每个被选特征之间的冗余信息。
-
公开(公告)号:CN112802555B
公开(公告)日:2022-04-19
申请号:CN202110147526.2
申请日:2021-02-03
Applicant: 南开大学
Abstract: 本发明提出一种基于多变量AUC的特征选择方法,从癌症的差异表达数据中选择最互补的基因子集,实现全局分类性能最大化。本发明首先基于特征的可能误分类集提出一种AUC计算的新角度;然后对于一个特征集,确定其共同可能误分类集并计算每个特征组合后的新AUC;一个特征的新AUC与原始AUC的差值展示了组合后特征集中的其他特征对该特征分类能力的互补作用。最后基于特征组合后的新AUC计算mvAUC,并增量式的选择使当前mvAUC最大化的候选特征加入被选特征子集。本发明方法具有可以直接评估被选特征子集的全局类辨别能力的优点,不需要成对地计算候选特征和每个被选特征之间的冗余信息。
-