-
公开(公告)号:CN119207587A
公开(公告)日:2024-12-27
申请号:CN202411745046.6
申请日:2024-12-02
Applicant: 吉林农业大学
Abstract: 本发明涉及基因分析生物信息学技术领域,具体公开一种基于大语言模型的基因数据分析的方法,该方法包括:对待分析基因数据质量进行分析,判断待分析基因数据是否可用并确定可用的基因数据基因序列分割方案,将基因序列分割后的基因数据输入至大语言模型,得到基因数据关联特征数据集及基因数据分析结果,确定基因数据分析准确性特征值,判断基因数据分析结果是否符合预期,本发明解决了传统的生物数据的质量和完整性问题对分析结果的准确性构成挑战,多模态数据的有效整合和分析仍需改进的问题,全流程优化了数据处理的效率,减少了重复计算、误判和无效结果的发生,提高分析效率,减少资源浪费。
-
公开(公告)号:CN119811487A
公开(公告)日:2025-04-11
申请号:CN202411971106.6
申请日:2024-12-30
Applicant: 西藏自治区农牧科学院水产科学研究所 , 吉林农业大学
IPC: G16B30/00 , G16B40/00 , G06N3/0455 , G06N3/08
Abstract: 本发明涉及生物信息学基因组装分析技术领域,具体公开一种基于人工智能技术的染色体T2T基因组的组装方法,该方法通过对基因测序数据进行一系列的分析及比对,基于构建的两种深度学习模型及支持向量机模型,获得了已确定位置关系的基因数据中已补齐未知碱基的基因数据和端粒数据,通过对数据分析处理,获得染色体T2T基因数据,经由格式整理,最终获得染色体T2T基因组。本发明不受研究物种的限制,分析过程中自动的完成了序列片段串联、补洞、端粒预测和添加,最终得到染色体T2T基因组。
-
公开(公告)号:CN119207587B
公开(公告)日:2025-03-28
申请号:CN202411745046.6
申请日:2024-12-02
Applicant: 吉林农业大学
Abstract: 本发明涉及基因分析生物信息学技术领域,具体公开一种基于大语言模型的基因数据分析的方法,该方法包括:对待分析基因数据质量进行分析,判断待分析基因数据是否可用并确定可用的基因数据基因序列分割方案,将基因序列分割后的基因数据输入至大语言模型,得到基因数据关联特征数据集及基因数据分析结果,确定基因数据分析准确性特征值,判断基因数据分析结果是否符合预期,本发明解决了传统的生物数据的质量和完整性问题对分析结果的准确性构成挑战,多模态数据的有效整合和分析仍需改进的问题,全流程优化了数据处理的效率,减少了重复计算、误判和无效结果的发生,提高分析效率,减少资源浪费。
-
公开(公告)号:CN119905148A
公开(公告)日:2025-04-29
申请号:CN202411973236.3
申请日:2024-12-30
Applicant: 西藏自治区农牧科学院水产科学研究所 , 吉林农业大学
IPC: G16B35/00 , G16B30/10 , G16B40/20 , G06F18/2411 , G06F18/243
Abstract: 本发明公开了一种双核体核间等位基因表达分析方法、装置及存储介质,涉及双核真菌的生物信息学转录组分析技术领域。其中,该方法包括:将双核体真菌的测序数据分别与两个核参考基因组进行比对分析;利用SVM模型对测序数据中每个reads进行核来源分类;将核1的所有基因序列作为查询集,核2的基因序列作为目标集,使用BLAST工具构建基因序列之间的相似性得分矩阵;将相似性评分与基因注释信息结合,通过LightGBM模型分析建立核间等位基因关系;生成counts文件,进行FPKM标准化处理,将标准化后的表达量结合核间等位基因关系索引进行分析,得出分析结果。通过本发明,实现了双核体真菌核间等位基因分析。
-
-
-