-
公开(公告)号:CN117995277B
公开(公告)日:2024-08-23
申请号:CN202410173253.2
申请日:2024-02-07
Applicant: 扬州大学
Abstract: 本发明提出一种适用于长序列的对数位置编码方法,包括以下步骤:从公共数据库中获取长序列数据,划分为训练集和验证集;构建一个用于定位序列元素的对数位置编码模块,获取序列的对数位置编码;搭建包括整合了对数位置编码的多头注意层,获取序列元素的注意层输出;基于自定义位置编码模块和多头注意层搭建数据编码器,对序列数据进行数据编码;将训练集序列数据输入到构建好的数据编码器模型中进行训练,使用性能指标评估模型性能,并保留表现最佳的模型。本发明在保持对序列内元素相对位置敏感的同时,也允许模型有效地处理长距离的元素关系,提高长序列处理的准确性和效率。
-
公开(公告)号:CN118335194A
公开(公告)日:2024-07-12
申请号:CN202410533877.0
申请日:2024-04-30
Applicant: 扬州大学
IPC: G16B30/10 , G06F16/2458 , G06F16/28 , G06N3/0464 , G06N3/084 , G16B40/20
Abstract: 本发明公开了一种基于卷积神经网络的病毒序列检索方法,包括以下步骤:步骤一:数据准备;步骤二:数据预处理;步骤三:模型训练;步骤四:构建特征向量数据库;步骤五:病毒序列检索。还公开了上述基于卷积神经网络的病毒序列检索方法的检索系统;本发明利用卷积神经网络提取病毒序列的高维特征表示,并使用欧几里得距离作为特征向量相识度度量的方法进行检索,可以更全面地捕获病毒序列之间的相似性和差异性,提高检索的准确性和效率。
-
公开(公告)号:CN117995277A
公开(公告)日:2024-05-07
申请号:CN202410173253.2
申请日:2024-02-07
Applicant: 扬州大学
Abstract: 本发明提出一种适用于长序列的对数位置编码方法,包括以下步骤:从公共数据库中获取长序列数据,划分为训练集和验证集;构建一个用于定位序列元素的对数位置编码模块,获取序列的对数位置编码;搭建包括整合了对数位置编码的多头注意层,获取序列元素的注意层输出;基于自定义位置编码模块和多头注意层搭建数据编码器,对序列数据进行数据编码;将训练集序列数据输入到构建好的数据编码器模型中进行训练,使用性能指标评估模型性能,并保留表现最佳的模型。本发明在保持对序列内元素相对位置敏感的同时,也允许模型有效地处理长距离的元素关系,提高长序列处理的准确性和效率。
-
-