一种基于信息熵的基因序列数字化实现方法及系统

    公开(公告)号:CN109903812A

    公开(公告)日:2019-06-18

    申请号:CN201910133090.4

    申请日:2019-02-22

    Abstract: 本发明公开了一种基于信息熵的基因序列数字化实现方法及系统。其中,所述方法包括:输入脱氧核糖核酸DNA序列,设定滑动窗口的长度l及子串长度n,和根据该设定的滑动窗口的长度l,从该输入的脱氧核糖核酸DNA序列的第一个碱基开始,步长为1,和计算该设定的滑动窗口内的给定子串长度下的拓扑熵大小,赋值给该设定的滑动窗口内的碱基,和重复计算该设定的滑动窗口内的给定子串长度下的拓扑熵大小,赋值给该设定的滑动窗口内的碱基,直到到达该输入的脱氧核糖核酸DNA序列的最后一个碱基位置,和输出得到同该输入的脱氧核糖核酸DNA序列长度的数字序列。通过上述方式,能够实现预测基因序列中的外显子区域。

    LncRNA预测方法、装置、计算设备及计算机可读存储介质

    公开(公告)号:CN112201308A

    公开(公告)日:2021-01-08

    申请号:CN202011085761.3

    申请日:2020-10-12

    Abstract: 本发明涉及一种LncRNA预测方法、装置、计算设备及计算机可读存储介质。所述LncRNA预测方法包括:获取包含LncRNA的原始数据;对所述包含LncRNA的原始数据进行数据处理,抽取出用于LncRNA预测的特征,所述特征至少包括提取自拓扑熵和广义拓扑熵的特征;将所述包含LncRNA的原始数据作为输入提供机器学习预测模型,所述机器学习预测模型基于所述用于LncRNA预测的特征对包含LncRNA的原始数据进行分类;获取所述机器学习预测模型的输出,得到LncRNA预测结果。本发明实现了有效的LncRNA预测,且加快了训练过程,而且对于DNA序列中其他功能元素的研究也具有可扩展性。

Patent Agency Ranking