-
公开(公告)号:CN117174182A
公开(公告)日:2023-12-05
申请号:CN202311078324.2
申请日:2023-08-25
Applicant: 江南大学
IPC: G16B50/00 , G16B50/10 , G16B30/10 , G06F16/22 , G06F16/2458
Abstract: 本发明公开了一种兼顾基因序列进化重排的序列搜索工具CircBLAST的应用方法,属于生物信息学技术领域。方法流程包括:首先,根据需要word_size的长度切分所有的蛋白序列,结合序列的注释数据构建数据集并写入数据库;然后准备请求序列,并将其切分成word_size的一个个小片段;进一步,通过搜索匹配、构建环形序列、序列比对完成检索过程;最后生成包含匹配片段、相似度得分等信息的比对结果,用于呈现给用户查看并判断匹配的可靠性。本发明考虑了基因序列的进化重排情况,显著提高了序列比对的准确性,并且可以发现更多的重排序列。
-
公开(公告)号:CN111445944B
公开(公告)日:2023-04-18
申请号:CN202010226916.4
申请日:2020-03-27
Applicant: 江南大学
IPC: G16B5/00 , G16B20/00 , G06N3/0464
Abstract: 本发明属于智能细胞生物识别领域,涉及基于多视角深度特征与多标签学习的RNA结合蛋白识别。该方法包括训练阶段和使用阶段两部分,训练阶段包括初始多视角数据构造、深度多视角特征提取模型和多标签分类器训练。初始多视角数据构造使用分子生物学原理和统计学原理将原始的RNA序列转换成氨基酸序列和二肽成分,获得氨基酸序列和二肽成分特征,然后和原始的RNA序列一起构建成初始多视角特征,为初始多视角特征构建模型。本发明基于最初的多视角数据,利用CNN进行深度学习来构造出深度多视角特征,相对于原始多视角特征,经过深度特征提取的多视角特征具有更小的数据维度和更高的分类效果。
-
公开(公告)号:CN111816255A
公开(公告)日:2020-10-23
申请号:CN202010658127.8
申请日:2020-07-09
Applicant: 江南大学
Abstract: 本发明属于生物信息学领域,涉及融合多视角和最优多标签链式学习的RNA结合蛋白识别。该方法包括训练阶段和使用阶段两部分,训练阶段包括初始多视角数据构造、多视角深度特征提取模型训练,多标签特征学习和最优多标签链式分类器训练。多视角包括RNA序列视角,氨基酸序列视角,多间隙二肽成分视角和RNA序列语义视角。本发明为了提高多视角特征的有效性,基于最初的多视角数据,利用CNN进行深度学习来构造出深度多视角特征。为了将多视角特征与多标签学习联系在一起,本发明建立多标签特征学习模型,用于整合所有视角的优势,使用区别于普通CC多标签分类器的最优CC链式分类器来学习标签之间的关联,更有效地提升分类精度。
-
公开(公告)号:CN111445944A
公开(公告)日:2020-07-24
申请号:CN202010226916.4
申请日:2020-03-27
Applicant: 江南大学
Abstract: 本发明属于智能细胞生物识别领域,涉及基于多视角深度特征与多标签学习的RNA结合蛋白识别。该方法包括训练阶段和使用阶段两部分,训练阶段包括初始多视角数据构造、深度多视角特征提取模型和多标签分类器训练。初始多视角数据构造使用分子生物学原理和统计学原理将原始的RNA序列转换成氨基酸序列和二肽成分,获得氨基酸序列和二肽成分特征,然后和原始的RNA序列一起构建成初始多视角特征,为初始多视角特征构建模型。本发明基于最初的多视角数据,利用CNN进行深度学习来构造出深度多视角特征,相对于原始多视角特征,经过深度特征提取的多视角特征具有更小的数据维度和更高的分类效果。
-
-
-
-