-
公开(公告)号:CN111261223A
公开(公告)日:2020-06-09
申请号:CN202010030316.0
申请日:2020-01-12
Applicant: 湖南大学
Abstract: 本发明属于生物信息学领域,公开了一种基于深度学习的CRISPR脱靶效应预测方法,通过使用BERT模型对人类基因组进行信息的抽取,有效地利用基因组的先验信息,并对数据进行有效地加强,最后将获取到的特征输入到LightGBM方法中进行训练预测,本发明解决了数据量少和数据不平衡的问题,并实现了对CRISPR脱靶效应的有效预测,具有十分重要的推广应用价值。
-
公开(公告)号:CN111261223B
公开(公告)日:2022-05-03
申请号:CN202010030316.0
申请日:2020-01-12
Applicant: 湖南大学
Abstract: 本发明属于生物信息学领域,公开了一种基于深度学习的CRISPR脱靶效应预测方法,通过使用BERT模型对人类基因组进行信息的抽取,有效地利用基因组的先验信息,并对数据进行有效地加强,最后将获取到的特征输入到LightGBM方法中进行训练预测,本发明解决了数据量少和数据不平衡的问题,并实现了对CRISPR脱靶效应的有效预测,具有十分重要的推广应用价值。
-
公开(公告)号:CN111199237A
公开(公告)日:2020-05-26
申请号:CN202010029057.X
申请日:2020-01-12
Applicant: 湖南大学
Abstract: 本发明属于计算机科学领域,公开了一种基于注意力的卷积神经网络分频特征提取方法。该方法通过将高频特征提取核与低频特征提取核相结合的方式,在多个空间频率上提取蕴含在输入数据中的特征,将低频特征及其提取核大小压缩,可以有效降低训练模型时所需的计算资源,减少内存消耗。采用高低频之间信息交换,可以提高特征提取的丰富度,获得准确率高、可靠的有意结果。结合自注意力机制,可以提高特征提取的效率,减少复杂任务所需的网络深度,缓解由此带来的梯度消失的问题。
-
公开(公告)号:CN110033824A
公开(公告)日:2019-07-19
申请号:CN201910296287.X
申请日:2019-04-13
Applicant: 湖南大学
IPC: G16B25/10
Abstract: 本发明属于基因表达谱分类领域,公开了一种基于共享字典学习的基因表达谱分类方法,属于稀疏字典学习在生物大数据上的挖掘和应用。本方法首先构建一个共享字典,该字典能够获取所有类别的样本;然后训练字典,在训练字典的同时还训练投影矩阵,并且投影矩阵对测试样本的投影可以加宽不同类型样本之间的距离;最后,通过使用字典重建测试样本的系数编码向量之间的距离判定类别。该方法能够快速高效地对基因表达谱数据分类,这有助于区分癌症种类及其亚型,帮助从分子层面认识肿瘤的致病机理,并为彻底治疗肿瘤提供基因层次的解决方案。该方法具有共享样本的能力,少量样本时能保持稳定的投影能力,和一般的分类方法相比较,分类准确度有很大提升。
-
-
-