-
公开(公告)号:CN113555064A
公开(公告)日:2021-10-26
申请号:CN202110815562.1
申请日:2021-07-19
Applicant: 江南大学
Abstract: 本发明公开了一种基于多角度编码和特征选择的DNA结合蛋白识别方法,包括,在训练阶段,iDBP‑DEP利用四种表示方法对蛋白质序列进行编码,得到3240维的特征向量作为初始特征;根据特征选择算法选择最优的特征子集;所述iDBP‑DEP将所述子集输入SVM分类器进行训练,得到预测模型;测试集中的每个蛋白质通过相同的步骤进行编码,得到对应的最佳特征子集,并输入所述预测模型中进行预测,最终获得相应的预测结果。本发明方法提供的iDBP‑DEP在各项评估指标上均展现了优越的性能,具有较良好的有效性和稳定性。