-
公开(公告)号:CN102629305B
公开(公告)日:2015-02-25
申请号:CN201210055566.5
申请日:2012-03-06
Applicant: 上海大学
IPC: G06F19/22
Abstract: 本发明公开了一种面向SNP数据的特征选择方法。其具体步骤如下:首先进行数据预处理;然后用重新设计的Relief算法剔除无关SNP特征;然后用改进的SVM-RFE算法对SNP特征进行关键性程度排序;最后使用十字交叉验证来筛选关键SNPs。该发明结合了Filter式特征选择和Wrapper式特征选择的优势,并在机器学习过程中使用二次划分方法,解决了SNP数据特征选择中的高维小样本及SNP致病组合模式的问题,提高了分析效率和准确率。
-
公开(公告)号:CN102629305A
公开(公告)日:2012-08-08
申请号:CN201210055566.5
申请日:2012-03-06
Applicant: 上海大学
IPC: G06F19/22
Abstract: 本发明公开了一种面向SNP数据的特征选择方法。其具体步骤如下:首先进行数据预处理;然后用重新设计的Relief算法剔除无关SNP特征;然后用改进的SVM-RFE算法对SNP特征进行关键性程度排序;最后使用十字交叉验证来筛选关键SNPs。该发明结合了Filter式特征选择和Wrapper式特征选择的优势,并在机器学习过程中使用二次划分方法,解决了SNP数据特征选择中的高维小样本及SNP致病组合模式的问题,提高了分析效率和准确率。
-