-
公开(公告)号:CN114564306B
公开(公告)日:2024-05-03
申请号:CN202210186254.1
申请日:2022-02-28
Applicant: 桂林电子科技大学
Abstract: 本发明公开了一种基于GPU并行计算的第三代测序RNA‑seq比对方法,该方法通过获取包含目标序列和查询序列的数据集,然后对查询序列即第三代测序的RNA‑seq进行数据纠错;以及数据索引和播种;再对播种得到的种子进行链算法;利用GPU并行计算进行基因组比对和剪接序列比对得到比对结果;最后对比对结果进行评估;经测试,本发明的方法通过预先对第三代测序数据纠错和剪接比对策略,提高了算法的准确率,又使用GPU并行计算算法提高了算法的运行速度。
-
公开(公告)号:CN114564306A
公开(公告)日:2022-05-31
申请号:CN202210186254.1
申请日:2022-02-28
Applicant: 桂林电子科技大学
Abstract: 本发明公开了一种基于GPU并行计算的第三代测序RNA‑seq比对方法,该方法通过获取包含目标序列和查询序列的数据集,然后对查询序列即第三代测序的RNA‑seq进行数据纠错;以及数据索引和播种;再对播种得到的种子进行链算法;利用GPU并行计算进行基因组比对和剪接序列比对得到比对结果;最后对比对结果进行评估;经测试,本发明的方法通过预先对第三代测序数据纠错和剪接比对策略,提高了算法的准确率,又使用GPU并行计算算法提高了算法的运行速度。
-
公开(公告)号:CN114550820A
公开(公告)日:2022-05-27
申请号:CN202210186243.3
申请日:2022-02-28
Applicant: 桂林电子科技大学
Abstract: 本发明公开了一种基于WFA算法的第三代测序RNA‑seq比对方法,该方法通过获取包含目标序列和查询序列的数据集;然后对参考基因组进行索引;以及区域选择和图映射;查找k长子字符串的最长公共子序列LCSk,再进行锚点过滤和锚点比对;引入注释文件获得比对结果,最后对比对结果进行评估。实验证明,本发明的方法有效地提高了序列比对的准确性,尤其是剪接位点比对的准确率,同时一定程度减少比对时间。
-
公开(公告)号:CN114550820B
公开(公告)日:2024-05-03
申请号:CN202210186243.3
申请日:2022-02-28
Applicant: 桂林电子科技大学
Abstract: 本发明公开了一种基于WFA算法的第三代测序RNA‑seq比对方法,该方法通过获取包含目标序列和查询序列的数据集;然后对参考基因组进行索引;以及区域选择和图映射;查找k长子字符串的最长公共子序列LCSk,再进行锚点过滤和锚点比对;引入注释文件获得比对结果,最后对比对结果进行评估。实验证明,本发明的方法有效地提高了序列比对的准确性,尤其是剪接位点比对的准确率,同时一定程度减少比对时间。
-
公开(公告)号:CN114566216B
公开(公告)日:2024-04-02
申请号:CN202210178010.9
申请日:2022-02-25
Applicant: 桂林电子科技大学
IPC: G16B20/30 , G16B40/00 , G06N3/084 , G06N3/045 , G06N3/0464
Abstract: 本发明公开了一种基于注意力机制的剪接位点预测及解释性方法,该方法提出结合注意力机制的卷积神经网络模型,精准识别剪接位点,并基于模型,提出可视化权重解释分析方法,在五个物种上建立了有效的预测模型。独立测试集的结果证明了在涉及五个物种的10个数据集上,本发明模型比现有模型更具有鲁棒性,性能更优,泛化能力更强。随后,为研究结合注意力机制的卷积神经网络模型能达到更好性能的原因,本发明采用于梯度类激活映射可视化技术获取模型对于每个样本的位置权重分布,最终验证了模型能够自动注意并获取到样本的有效特征。本发明可以提高预测精度和对剪接位点序列进行解释性分析。
-
公开(公告)号:CN114566215B
公开(公告)日:2024-03-22
申请号:CN202210178009.6
申请日:2022-02-25
Applicant: 桂林电子科技大学
IPC: G16B20/30 , G16B40/00 , G06N3/084 , G06N3/0464
Abstract: 本发明公开了一种双端成对的剪接位点预测方法,该方法通过获取双端成对的剪接位点样本序列作为基准数据集和独立数据集;将碱基序列通过基于序列本身、物理化学性质等多种特征提取方式进行编码;组合多种特征作为一个多通道多维的向量表示;训练卷积神经网络模型;最后进行评估。这种预测方法可以结合样本多种特征表示方式,帮助卷积神经网络充分学习样本内在模式,提高了双端成对的剪接位点预测的准确率。
-
公开(公告)号:CN114566216A
公开(公告)日:2022-05-31
申请号:CN202210178010.9
申请日:2022-02-25
Applicant: 桂林电子科技大学
Abstract: 本发明公开了一种基于注意力机制的剪接位点预测及解释性方法,该方法提出结合注意力机制的卷积神经网络模型,精准识别剪接位点,并基于模型,提出可视化权重解释分析方法,在五个物种上建立了有效的预测模型。独立测试集的结果证明了在涉及五个物种的10个数据集上,本发明模型比现有模型更具有鲁棒性,性能更优,泛化能力更强。随后,为研究结合注意力机制的卷积神经网络模型能达到更好性能的原因,本发明采用于梯度类激活映射可视化技术获取模型对于每个样本的位置权重分布,最终验证了模型能够自动注意并获取到样本的有效特征。本发明可以提高预测精度和对剪接位点序列进行解释性分析。
-
公开(公告)号:CN114566215A
公开(公告)日:2022-05-31
申请号:CN202210178009.6
申请日:2022-02-25
Applicant: 桂林电子科技大学
Abstract: 本发明公开了一种双端成对的剪接位点预测方法,该方法通过获取双端成对的剪接位点样本序列作为基准数据集和独立数据集;将碱基序列通过基于序列本身、物理化学性质等多种特征提取方式进行编码;组合多种特征作为一个多通道多维的向量表示;训练卷积神经网络模型;最后进行评估。这种预测方法可以结合样本多种特征表示方式,帮助卷积神经网络充分学习样本内在模式,提高了双端成对的剪接位点预测的准确率。
-
-
-
-
-
-
-