一种GPCR蛋白序列的识别方法及计算机可读存储介质

    公开(公告)号:CN117437983A

    公开(公告)日:2024-01-23

    申请号:CN202311471325.3

    申请日:2023-11-07

    Abstract: 本发明提供一种GPCR蛋白序列的识别方法及计算机可读存储介质,包括:获取待识别的GPCR蛋白序列,使用PsePSSM提取方法提取蛋白序列的GPCR特征;将所述GPCR特征输入预先训练完成的MLapRVFL分类模型中,得到所述MLapRVFL分类模型输出的识别结果,其中,所述MLapRVFL分类模型是通过将多拉普拉斯和L2,1‑norm正则化项引入基本的随机向量功能链接RVFL方法中进行训练得到的,且所述MLapRVFL分类模型根据Spec、ACC、SN、MCC、AUC至少五个衡量指标衡量MLapRVFL分类模型的准确度,根据实验结果显示,PsePSSM特征提取方法相对于其他特征提取方法在MLapRVFL分类模型上的ACC、AUC衡量指标上能获得了更好的分类效果,本发明相比现有的机器学习方法在GPCR数据集上也有更好的分类性能,且提高了GPCR蛋白质序列的预测准确性。

Patent Agency Ranking