一种基于大语言模型的基因数据分析的方法

    公开(公告)号:CN119207587A

    公开(公告)日:2024-12-27

    申请号:CN202411745046.6

    申请日:2024-12-02

    Abstract: 本发明涉及基因分析生物信息学技术领域,具体公开一种基于大语言模型的基因数据分析的方法,该方法包括:对待分析基因数据质量进行分析,判断待分析基因数据是否可用并确定可用的基因数据基因序列分割方案,将基因序列分割后的基因数据输入至大语言模型,得到基因数据关联特征数据集及基因数据分析结果,确定基因数据分析准确性特征值,判断基因数据分析结果是否符合预期,本发明解决了传统的生物数据的质量和完整性问题对分析结果的准确性构成挑战,多模态数据的有效整合和分析仍需改进的问题,全流程优化了数据处理的效率,减少了重复计算、误判和无效结果的发生,提高分析效率,减少资源浪费。

    一种基于大语言模型的基因数据分析的方法

    公开(公告)号:CN119207587B

    公开(公告)日:2025-03-28

    申请号:CN202411745046.6

    申请日:2024-12-02

    Abstract: 本发明涉及基因分析生物信息学技术领域,具体公开一种基于大语言模型的基因数据分析的方法,该方法包括:对待分析基因数据质量进行分析,判断待分析基因数据是否可用并确定可用的基因数据基因序列分割方案,将基因序列分割后的基因数据输入至大语言模型,得到基因数据关联特征数据集及基因数据分析结果,确定基因数据分析准确性特征值,判断基因数据分析结果是否符合预期,本发明解决了传统的生物数据的质量和完整性问题对分析结果的准确性构成挑战,多模态数据的有效整合和分析仍需改进的问题,全流程优化了数据处理的效率,减少了重复计算、误判和无效结果的发生,提高分析效率,减少资源浪费。

    一种核间等位基因表达分析方法、装置及存储介质

    公开(公告)号:CN119905148A

    公开(公告)日:2025-04-29

    申请号:CN202411973236.3

    申请日:2024-12-30

    Abstract: 本发明公开了一种双核体核间等位基因表达分析方法、装置及存储介质,涉及双核真菌的生物信息学转录组分析技术领域。其中,该方法包括:将双核体真菌的测序数据分别与两个核参考基因组进行比对分析;利用SVM模型对测序数据中每个reads进行核来源分类;将核1的所有基因序列作为查询集,核2的基因序列作为目标集,使用BLAST工具构建基因序列之间的相似性得分矩阵;将相似性评分与基因注释信息结合,通过LightGBM模型分析建立核间等位基因关系;生成counts文件,进行FPKM标准化处理,将标准化后的表达量结合核间等位基因关系索引进行分析,得出分析结果。通过本发明,实现了双核体真菌核间等位基因分析。

Patent Agency Ranking