基于氨基酸组成和蛋白质相互作用识别抗氧化蛋白方法

    公开(公告)号:CN113611355A

    公开(公告)日:2021-11-05

    申请号:CN202110950026.2

    申请日:2021-08-18

    Abstract: 基于氨基酸组成和蛋白质相互作用识别抗氧化蛋白方法,涉及医药技术领域,针对现有技术中根据序列信息预测的二级结构,使用PSI‑PRED等工具提取蛋白质二级结构信息的特征时,预测的蛋白质二级结构存在误差,进而导致抗氧化蛋白识别准确低的问题,本申请提出了一种全新的抗氧化蛋白识别方法,利用蛋白质‑蛋白质相互作用的特征和氨基酸的组成来表达抗氧化蛋白序列的特征,能够实现对抗氧化蛋白的准确识别,为相应蛋白质定位、疾病分析及药物研究提供了理论基础。本申请在处理不平衡的抗氧化蛋白数据时引入了多种不平衡数据处理方法,最终使用SMOTE算法处理数据得到的模型最优,优化了抗氧化蛋白的识别效果。

    基于位置特异性得分矩阵的囊泡转运蛋白识别方法及识别设备

    公开(公告)号:CN113764043B

    公开(公告)日:2022-05-20

    申请号:CN202111063261.4

    申请日:2021-09-10

    Abstract: 基于位置特异性得分矩阵的囊泡转运蛋白识别方法及识别设备,本发明涉及囊泡转运蛋白识别方法及识别设备。本发明的目的是为了解决现有囊泡转运蛋白的识别方法效率低、成本高的问题。过程为:S1、获取蛋白序列数据文件;S2、基于S1生成位置特异性得分矩阵,并采用AATP算法从位置特异性得分矩阵中提取特征向量;S3、使用不平衡处理算法得到处理后的特征向量;S4、采用MRMD算法得到特征向量集合;S5、采用XGBoost作为分类器,并进行超参数优化;S6、得到训练好的分类器模型;S7、将待测数据集输入训练好的分类器模型得到分类结果,完成对囊泡转运蛋白的识别。本发明用于蛋白识别领域。

    基于深度学习的nanopore测序数据碱基识别方法

    公开(公告)号:CN113870949A

    公开(公告)日:2021-12-31

    申请号:CN202111172443.5

    申请日:2021-10-08

    Abstract: 基于深度学习的nanopore测序数据碱基识别方法,涉及生物信息学领域,针对现有技术中nanopore测序准确率低的问题,一:下载包括肺杆菌、肠杆菌、变形杆菌在内的50组nanopore原始数据作为训练集;二:对50组原始数据进行碱基识别,得到碱基序列;三:获取准确率在99%以上的Illumina测序序列,并以准确率在99%以上的Illumina测序序列作为参考基因组,以参考基因组作为ground truth并使用Tombo算法对碱基序列进行校正;四:使用Re‑squiggle方法将校正后的碱基序列转换为对应的电信号数据,然后将电信号数据进行标记;五:利用标记后的电信号数据以及原始数据训练神经网络,并利用训练好的神经网络进行碱基识别。本申请实现了对nanopore测序数据碱基序列高准确的识别。

    基于位置特异性得分矩阵的囊泡转运蛋白识别方法及识别设备

    公开(公告)号:CN113764043A

    公开(公告)日:2021-12-07

    申请号:CN202111063261.4

    申请日:2021-09-10

    Inventor: 汪国华 宫越 邹权

    Abstract: 基于位置特异性得分矩阵的囊泡转运蛋白识别方法及识别设备,本发明涉及囊泡转运蛋白识别方法及识别设备。本发明的目的是为了解决现有囊泡转运蛋白的识别方法效率低、成本高的问题。过程为:S1、获取蛋白序列数据文件;S2、基于S1生成位置特异性得分矩阵,并采用AATP算法从位置特异性得分矩阵中提取特征向量;S3、使用不平衡处理算法得到处理后的特征向量;S4、采用MRMD算法得到特征向量集合;S5、采用XGBoost作为分类器,并进行超参数优化;S6、得到训练好的分类器模型;S7、将待测数据集输入训练好的分类器模型得到分类结果,完成对囊泡转运蛋白的识别。本发明用于蛋白识别领域。

Patent Agency Ranking