基于排序学习技术的蛋白质同源特征表示方法

    公开(公告)号:CN119152941A

    公开(公告)日:2024-12-17

    申请号:CN202411211254.8

    申请日:2024-08-30

    Abstract: 本发明公开了基于排序学习技术的蛋白质同源特征表示方法,包括如下步骤:训练一个对PSI‑BLAST结果可以修正的排序模型;将搜索序列输入到PSI‑BLAST中,使用一次迭代搜索出相似的蛋白质列表;使用排序模型来对上一次搜索出的相似性蛋白质列表进行重新排序;使用PSI‑BLAST默认的E‑value计算需要构建多序列比对的序列个数,从上一步重新排序列表中提取相应数目的蛋白质;本发明通过构建基于排序学习技术的蛋白质同源特征表示方法,一方面通过排序学习技术降低已有同源搜索方法中的非同源噪音问题,另一方面通过排序学习技术将改进的同源搜索方法进行融合,发挥不同方法之间的互补性,进一步提高搜索结果中同源特征的质量。

Patent Agency Ranking