-
公开(公告)号:CN117497066A
公开(公告)日:2024-02-02
申请号:CN202311389932.5
申请日:2023-10-24
Applicant: 华中农业大学
Abstract: 本发明公开了一种基于染色质交互高精度预测玉米基因表达量的方法,其特征在于,该方法通过构建的DeepCBA模型实现,包括:对输入染色质序列进行one‑hot编码处理;将编码后的序列输入卷积神经网络,实现特征降维和特征提取。为了捕获序列中的时序特征,利用双向长短期记忆网络捕获隐藏在DNA序列中的时序特征,得到两个向量矩阵,垂直拼接两个向量矩阵。使用注意力机制增强关键特征对模型的贡献,并使用Dropout防止过拟合等。在输出层,使用sigmoid/linear函数完成相应的基于启动子近端和远端染色质交互的玉米基因表达量预测;并识别和挖掘玉米染色质序列中潜在的重要基序。本发明实现了对基因表达量的从头预测,进而为基因表达量精准设计乃至未来智能育种提供了新的思路。
-
公开(公告)号:CN117711484A
公开(公告)日:2024-03-15
申请号:CN202311826967.0
申请日:2023-12-27
Applicant: 华中农业大学
IPC: G16B20/00 , G16B40/00 , G06N3/0464 , G06N3/08 , G06N3/047
Abstract: 本发明公开了一种基于深度学习的复杂性状高效基因组预测方法,包括:S1,获取测序得到的全基因组数据以及田间获取的表型数据,并对其数据预处理;S2,通过充分提取SNP位点间的局部和全局特征,构建单性状基因组预测模型;S3,通过计算表型性状之间的相关性确定辅助性状的数量,构建多性状联合基因组预测深度学习模型;S4,基于预处理后的全基因组数据和表型数据训练gMLP模型和MT‑gMLP模型,进而实现育种决策辅助;S5,通过Saliency map的可解释技术解析MT‑gMLP模型与gMLP模型预测准确率差异的原因,以及挖掘表型相关的潜在基因以及功能位点。本发明实现了基于SNP数据精准预测复杂性状的表型值,进而加快作物智能设计育种。
-