基于堆叠集成模型的囊泡转运蛋白识别方法

    公开(公告)号:CN115641915A

    公开(公告)日:2023-01-24

    申请号:CN202211290019.5

    申请日:2022-10-21

    Inventor: 陈宇 高立欣

    Abstract: 本发明涉及一种基于堆叠集成模型的囊泡转运蛋白识别方法,其中基于堆叠集成模型的囊泡转运蛋白识别方法包括:首先,我们对数据集进行训练集和测试集的划分,并使用随机欠采样对不平衡数据集进行处理;其次,从蛋白质序列提取PSSM特征,随后从PSSM中进一步提取氨基酸伪组成、二肽伪组成、氨基酸组成和二肽组成特征,并使用MRMD算法选择最优特征子集;最后,将最优特征子集输入到堆叠分类器进行囊泡转运蛋白进行识别。

Patent Agency Ranking