使用KNN计算与相似性比对预测蛋白质亚细胞区间方法

    公开(公告)号:CN105760711A

    公开(公告)日:2016-07-13

    申请号:CN201610072828.7

    申请日:2016-02-02

    Applicant: 江南大学

    CPC classification number: G16B20/00

    Abstract: 本发明公开了一种使用KNN计算与相似性比对预测蛋白质亚细胞区间方法,其特征在于,包括以下步骤:步骤1、提取蛋白质序列数据集中所有蛋白质序列的AAC特征;步骤2、通过KNN算法,确定预测范围内的蛋白质序列集合;步骤3、进行Blast相似性比对计算,得到最高相似性序列;最高相似性序列所属的区间就是所预测序列的所属区间。本发明的预测准确率较高,尤其在传统方法预测准确率较低的亚细胞类上识别精度明显提高,对准确预测未知蛋白的亚细胞位置具有重要作用。

Patent Agency Ranking