-
公开(公告)号:CN104376234B
公开(公告)日:2017-12-26
申请号:CN201410727536.3
申请日:2014-12-03
Applicant: 苏州大学
IPC: G06F19/22
Abstract: 本发明公开了一种启动子识别方法及系统:获取测试数据,确定所述测试数据的一次特征向量;利用自编码器,对所述测试数据的一次特征向量进行特征提取,得到所述测试数据的二次特征向量;利用预设支持向量机,对所述测试数据的二次特征向量进行分类,得到分类结果,当所述分类结果满足预设条件时,确定所述测试数据为启动子。相较现有技术中直接对利用KL散度提取到的特征向量进行分类判定,本发明利用了自编码器的神经网络学习算法,有效地提高了对启动子的识别性能,进而提高了识别准确度。
-
公开(公告)号:CN103870719B
公开(公告)日:2017-06-16
申请号:CN201410140707.2
申请日:2014-04-09
Applicant: 苏州大学
IPC: G06F19/10
Abstract: 本申请公开了一种启动子识别方法,通过对多个样本基因序列进行胞嘧啶、鸟嘌呤CG偏好特征的统计,将多个样本基因序列分为两类,针对每一类样本基因序列分别执行以下步骤:分别提取其中每一个样本基因序列的刚性特征、CpG岛特征和四联体组成成分特征,并构建对应的分类器来对样本基因序列进行启动子识别判断,对识别的非启动子序列提取其五联体组成成分特征并构成五联体分类器,再次进行启动子识别判断,并在识别结果满足预设条件时,确定当前样本基因序列为启动子序列,否则为非启动子序列。本申请充分考虑了基因的刚性特征、CpG岛特征和组成成分特征,通过分级识别,最终给出的启动子识别结果准确率更高。
-
公开(公告)号:CN104462870A
公开(公告)日:2015-03-25
申请号:CN201510011796.5
申请日:2015-01-09
Applicant: 苏州大学
IPC: G06F19/24
Abstract: 本发明提供了一种人类基因启动子识别方法及装置,现有技术中典型的非启动子具体包括外显子、内含子和3’-UTR,因此本申请预先分别构建预设启动子-外显子分类器、预设启动子-内含子分类器和预设启动子-3’-UTR分类器,相对于传统的启动子-非启动子的分类器,由于每个分类器中只有两个类别,不会出现交叉分类的情况,所以分类性能显著提高。并且分类器的基因训练序列中启动子与外显子的数量一致,启动子与内含子的数量一致,启动子与3’-UTR的数量一致,因此保证每个分类器中启动子和非启动子样本平衡,使得分类器能够依据平衡样本进行分类,因此能够准确识别启动子,解决现有技术中假阳性的问题,进而提高分类器的分类性能。
-
公开(公告)号:CN104376234A
公开(公告)日:2015-02-25
申请号:CN201410727536.3
申请日:2014-12-03
Applicant: 苏州大学
IPC: G06F19/22
Abstract: 本发明公开了一种启动子识别方法及系统:获取测试数据确定所述测试数据的一次特征向量;利用自编码器,对所述测试数据的一次特征向量进行特征提取,得到所述测试数据的二次特征向量;利用预设支持向量机,对所述测试数据的二次特征向量进行分类,得到分类结果,当所述分类结果满足预设条件时,确定所述测试数据为启动子。相较现有技术中直接对利用KL散度提取到的特征向量进行分类判定,本发明利用了自编码器的神经网络学习算法,有效地提高了对启动子的识别性能,进而提高了识别准确度。
-
公开(公告)号:CN105550538B
公开(公告)日:2018-06-01
申请号:CN201610076071.9
申请日:2016-02-03
Applicant: 苏州大学
IPC: G06F19/24
Abstract: 本申请公开了一种人类基因启动子识别方法和系统。该方法在获取人类基因训练样本后,基于启动子与三个非启动子之间的对称散度,从所有N联体集合中确定最具有分辨率的N联体集合。进而,利用具有分辨率的N联体集合完成对分类器的训练,并利用训练后的分类器对人类基因测试样本进行识别。与先有技术相比,本发明采用对称散度作为述启动子和非启动子的之间的距离度量,由于对称散度的对称性,因而其作为距离度量的测量精度更高,从而提高了对启动子的识别度。
-
公开(公告)号:CN103955944B
公开(公告)日:2018-01-19
申请号:CN201410218968.1
申请日:2014-05-22
Applicant: 苏州大学
Abstract: 本发明提供一种图像边缘检测方法和装置,通过本发明实施例提供的图像边缘检测方法,在获取M个初始设定的窗口Ni对应的一阶边缘检测算子和二阶边缘检测算子后,可以利用M个一阶边缘检测算子得到一阶边缘检测图像以及利用M个二阶边缘检测算子得到二阶边缘检测图像;然后将一阶边缘检测图像和二阶边缘检测图像进行逻辑或运算,得到边缘检测图像。与现有技术相比,本发明实施例提供的图像边缘检测方法提出了同时基于一阶边缘检测算子和二阶边缘检测算子检测图像边缘的方法。并且经过发明人多次实验证明,将一阶边缘检测图像和二阶边缘检测图像进行逻辑或运算后,边缘检测图像中的噪声降低,从而提高边缘检测图像的抗噪能力。
-
公开(公告)号:CN105550538A
公开(公告)日:2016-05-04
申请号:CN201610076071.9
申请日:2016-02-03
Applicant: 苏州大学
IPC: G06F19/24
CPC classification number: G06F19/24
Abstract: 本申请公开了一种人类基因启动子识别方法和系统。该方法在获取人类基因训练样本后,基于启动子与三个非启动子之间的对称散度,从所有N联体集合中确定最具有分辨率的N联体集合。进而,利用具有分辨率的N联体集合完成对分类器的训练,并利用训练后的分类器对人类基因测试样本进行识别。与先有技术相比,本发明采用对称散度作为述启动子和非启动子的之间的距离度量,由于对称散度的对称性,因而其作为距离度量的测量精度更高,从而提高了对启动子的识别度。
-
公开(公告)号:CN104834834A
公开(公告)日:2015-08-12
申请号:CN201510166526.1
申请日:2015-04-09
Applicant: 苏州大学张家港工业技术研究院
Abstract: 本发明的启动子识别系统的构建方法和装置,将包含多条基因序列的数据集划分为具有预设属性的第一数据子集和不具有预设属性的第二数据子集;并分别提取第一、第二数据子集的多种预设特征,所述预设特征包括基因刚性特征;之后,对特征提取所得的多个特征数据集合进行建模,得到构成启动子识别系统所需的各个子分类器模型。可见,本发明在构建人类基因启动子识别系统时,考虑了基因结构特征(如基因刚性特征),通过提取基因数据的基因刚性特征,并将提取的基因刚性特征作为训练数据进行建模,使最终的识别系统具备了结合基因结构特征识别启动子的能力,提升了系统的识别性能。
-
公开(公告)号:CN103955944A
公开(公告)日:2014-07-30
申请号:CN201410218968.1
申请日:2014-05-22
Applicant: 苏州大学
IPC: G06T7/00
Abstract: 本发明提供一种图像边缘检测方法和装置,通过本发明实施例提供的图像边缘检测方法,在获取M个初始设定的窗口Ni对应的一阶边缘检测算子和二阶边缘检测算子后,可以利用M个一阶边缘检测算子得到一阶边缘检测图像以及利用M个二阶边缘检测算子得到二阶边缘检测图像;然后将一阶边缘检测图像和二阶边缘检测图像进行逻辑或运算,得到边缘检测图像。与现有技术相比,本发明实施例提供的图像边缘检测方法提出了同时基于一阶边缘检测算子和二阶边缘检测算子检测图像边缘的方法。并且经过发明人多次实验证明,将一阶边缘检测图像和二阶边缘检测图像进行逻辑或运算后,边缘检测图像中的噪声降低,从而提高边缘检测图像的抗噪能力。
-
公开(公告)号:CN103870719A
公开(公告)日:2014-06-18
申请号:CN201410140707.2
申请日:2014-04-09
Applicant: 苏州大学
IPC: G06F19/10
Abstract: 本申请公开了一种启动子识别方法,通过对多个样本基因序列进行胞嘧啶、鸟嘌呤CG偏好特征的统计,将多个样本基因序列分为两类,针对每一类样本基因序列分别执行以下步骤:分别提取其中每一个样本基因序列的刚性特征、CpG岛特征和四联体组成成分特征,并构建对应的分类器来对样本基因序列进行启动子识别判断,对识别的非启动子序列提取其五联体组成成分特征并构成五联体分类器,再次进行启动子识别判断,并在识别结果满足预设条件时,确定当前样本基因序列为启动子序列,否则为非启动子序列。本申请充分考虑了基因的刚性特征、CpG岛特征和组成成分特征,通过分级识别,最终给出的启动子识别结果准确率更高。
-
-
-
-
-
-
-
-
-