-
公开(公告)号:CN110942803A
公开(公告)日:2020-03-31
申请号:CN201911151918.5
申请日:2019-11-22
Applicant: 中南林业科技大学
IPC: G16B15/00
Abstract: 本发明公开一种LncRNA和环境因素关联关系的高效预测方法,主要包括以下步骤:1、下载数据集,得到LncRNA和环境因素(EF)的列表,和二者关联关系的关联矩阵A;然后分别计算出LncRNA和EF的高斯相互作用属性核相似矩阵KL、KE。2、计算EF之间的化学结构相似性矩阵E。3、将KL进行逻辑斯蒂函数转换,得到相似矩阵SL;且利用E和KE构建EF的相似矩阵SE。4、融合A、SL和SE构建一个全局异构网络G;利用重启随机游走计算扩散特征,并使用奇异值分解降维。5、计算lncRNA-EF对的Hetesim得分。6、结合扩散特征和HeteSim得分得到特征数据集并用于训练梯度提升树分类器去预测LncRNA-EF的关联关系。7、使用10折交叉验证方法对提出的方法进行验证。应用本发明预测LncRNA和EF关联关系的精度高。