-
公开(公告)号:CN116030881A
公开(公告)日:2023-04-28
申请号:CN202211596221.0
申请日:2022-12-13
Applicant: 北京邮电大学
Abstract: 本发明提出一种基于人工智能的基因及基因簇功能预测方法,包括,获取目标基因组的所有蛋白序列;利用已有目标功能的蛋白质的功能注释信息,构建模型训练集,训练得到预测模型;通过预测模型对所有蛋白序列进行目标功能的预测,获取蛋白序列的序列信息功能得分;利用蛋白质结构预测模型对蛋白序列的结构进行目标功能的预测,获取蛋白序列的结构信息功能得分;将序列信息功能得分和结构信息功能得分综合的结果作为蛋白序列的最终得分,根据所有蛋白序列的最终得分,评估目标基因组上的所有基因簇,挑选分值最大的基因簇作为候选基因簇。本发明为每个感兴趣的功能,针对性的构建数据集和序列预测模型,进行特定功能基因簇的预测、判别和筛选。