-
公开(公告)号:CN120048358A
公开(公告)日:2025-05-27
申请号:CN202510506112.2
申请日:2025-04-22
Applicant: 广东省农业科学院水稻研究所
IPC: G16B40/00 , G16B20/20 , G16B25/10 , G16B50/10 , G06N3/0455 , G06N3/0464 , G06N3/0985 , G06N5/045
Abstract: 本发明提供了一种植物表型多精度信息联合预测方法,涉及植物表型预测的技术领域,其方法步骤包括:数据获取及预处理;模型构建与训练;可解释性分析,本发明方法可应用于不同物种和多种植物性状,并可拓展至其他生物学领域;可灵活增补新的组学数据与分析功能,满足大规模多组学研究的未来需求;相比传统线性或一般机器学习方法,深度学习模型在复杂基因互作场景下表现更佳,并保持稳定预测性能。
-
公开(公告)号:CN118116451B
公开(公告)日:2025-01-07
申请号:CN202410286173.8
申请日:2024-03-13
Applicant: 广东省农业科学院水稻研究所
Abstract: 本发明公开了一种基于重测序的InDel背景分子标记设计方法及应用,包括数据预处理模块、变异位点筛选模块、引物设计模块和背景分子标记开发模块。本发明实现了基于重测序数据,在全基因组范围内鉴定和筛选InDe l标记,并进行引物设计和背景分子标记开发,具有操作灵活、自动化程度高和批量高效等优点。本发明基于样本的重测序数据设计背景分子标记,与传统的基于参考基因组设计引物相比,引物特异性更强、密度更高、数量更多。本发明创新性使用划窗对InDel变异进行筛选,统一了每个窗口只允许存在一个InDel标记,减少了基于参考基因组直接寻找变异位点的不确定性,保证了背景分子标记的可靠性和基因分型能力。
-
公开(公告)号:CN119990143A
公开(公告)日:2025-05-13
申请号:CN202510464941.9
申请日:2025-04-15
Applicant: 广东省农业科学院水稻研究所
IPC: G06F40/30 , G06F40/295 , G16B30/10 , G06N3/0455 , G06N5/02 , G06N5/025 , G06N5/04
Abstract: 本发明提供了一种基于深度学习的mRNA领域文献挖掘系统,涉及生物信息学与自然语言处理的技术领域,能够有效识别与mRNA相关的实体包括基因、蛋白质、疾病等及其语义关系;本发明系统结合了最新的BioBERT模型和Transformer‑CRF模型,通过多任务学习架构实现命名实体识别和关系提取的高效协同优化,显著提升了mRNA领域文献挖掘的精度与效率;能够有效处理生物医学领域特有的术语和复杂句法结构,并通过多任务优化减少冗余、提升整体性能;通过融合BioBERT的预训练知识与Transformer‑CRF的序列标注能力,为mRNA相关文献的深度挖掘与知识发现提供了创新的技术支持,具有广泛的应用前景。
-
公开(公告)号:CN118983005A
公开(公告)日:2024-11-19
申请号:CN202411063176.1
申请日:2024-08-05
Applicant: 广东省农业科学院水稻研究所
IPC: G16B20/30 , G16B40/00 , G06N3/042 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种植物表型多组学预测方法,包括:构建包括转录组预测模块、第一输出模块、基因组预测模块、第二输出模块和综合训练模块的多组学表型预测模型;获取植物的SNP数据和基因表达数据并进行预处理,对应得到SNP特征和基因表达特征;将基因表达特征输入至转录组预测模块,得到转录组数据特征;将转录组数据特征输入至第一输出模块,得到第一预测表型;将SNP特征输入至基因组预测模块,得到基因组数据特征;将基因组数据特征输入至第二输出模块,得到第二预测表型;将转录组数据特征和基因组数据特征连接后输入至综合训练模块,得到第三预测表型。结合基因网络和深度学习的方法有望克服现有方法的局限,进一步提升植物表型预测精度。
-
公开(公告)号:CN118116451A
公开(公告)日:2024-05-31
申请号:CN202410286173.8
申请日:2024-03-13
Applicant: 广东省农业科学院水稻研究所
Abstract: 本发明公开了一种基于重测序的InDel背景分子标记设计方法及应用,包括数据预处理模块、变异位点筛选模块、引物设计模块和背景分子标记开发模块。本发明实现了基于重测序数据,在全基因组范围内鉴定和筛选InDe l标记,并进行引物设计和背景分子标记开发,具有操作灵活、自动化程度高和批量高效等优点。本发明基于样本的重测序数据设计背景分子标记,与传统的基于参考基因组设计引物相比,引物特异性更强、密度更高、数量更多。本发明创新性使用划窗对InDel变异进行筛选,统一了每个窗口只允许存在一个InDel标记,减少了基于参考基因组直接寻找变异位点的不确定性,保证了背景分子标记的可靠性和基因分型能力。
-
-
-
-