-
公开(公告)号:CN112562788B
公开(公告)日:2022-06-28
申请号:CN202011575605.5
申请日:2020-12-28
Applicant: 上海交通大学
IPC: G16B30/00 , G16B50/30 , G16B20/00 , G06Q10/04 , G06N3/08 , G06F40/289 , G06F40/242
Abstract: 本发明公开了一种环状RNA‑RNA结合蛋白关系预测模型构建方法,解决了现有技术仅限制了预测准确率的问题,其技术方案要点是将初始的环状RNA序列数据集样本构造为环状RNA‑RNA结合蛋白序列对的形式;采用自监督学习的方式训练得到词向量字典;根据训练得到的词向量字典,将样本序列对映射成对应的词向量矩阵作为表征;将样本序列对的向量表征对应输入伪孪生网络,得到编码后的特征向量输入到度量函数中,计算绑定概率预测值并计算获得其与标签的差值,优化模型参数;模型训练迭代结束后保存得到的模型,本发明的环状RNA‑RNA结合蛋白关系预测模型构建方法,能针对RNA序列和蛋白质序列进行数据挖掘,能有效提高环状RNA‑RNA结合蛋白结合预测的准确率。
-
公开(公告)号:CN112562788A
公开(公告)日:2021-03-26
申请号:CN202011575605.5
申请日:2020-12-28
Applicant: 上海交通大学
IPC: G16B30/00 , G16B50/30 , G16B20/00 , G06Q10/04 , G06N3/08 , G06F40/289 , G06F40/242
Abstract: 本发明公开了一种环状RNA‑RNA结合蛋白关系预测模型构建方法,解决了现有技术仅限制了预测准确率的问题,其技术方案要点是将初始的环状RNA序列数据集样本构造为环状RNA‑RNA结合蛋白序列对的形式;采用自监督学习的方式训练得到词向量字典;根据训练得到的词向量字典,将样本序列对映射成对应的词向量矩阵作为表征;将样本序列对的向量表征对应输入伪孪生网络,得到编码后的特征向量输入到度量函数中,计算绑定概率预测值并计算获得其与标签的差值,优化模型参数;模型训练迭代结束后保存得到的模型,本发明的环状RNA‑RNA结合蛋白关系预测模型构建方法,能针对RNA序列和蛋白质序列进行数据挖掘,能有效提高环状RNA‑RNA结合蛋白结合预测的准确率。
-