-
公开(公告)号:CN103390119B
公开(公告)日:2016-01-27
申请号:CN201310277169.7
申请日:2013-07-03
Applicant: 哈尔滨工程大学
IPC: G06F19/12
Abstract: 本发明属于分子生物信息检测领域,具体涉及一种基于条件随机场技术,融合ChIP-chip基因芯片数据和ChIP-seq DNA测序数据的转录因子结合位点识别方法。本发明包括:建立条件随机场模型;获取ChIP-chip实验检测值,识别出对应状态值;获取ChIP-seq实验检测值识别出对应状态值;测试条件随机场模型的识别精度;加权融合识别结果的第n个DNA碱基片段识别概率;比较和识别转录因子结合位点。本发明利用条件随机场融合ChIP-chip和ChIP-seq实验的检测数据识别转录因子结合位点。通过实验验证,在识别准确率方面,本发明方法要高于采用单一技术的识别方法。
-
公开(公告)号:CN108280326B
公开(公告)日:2021-06-11
申请号:CN201810057821.7
申请日:2018-01-22
Applicant: 哈尔滨工程大学
Abstract: 本发明提供一种基于深度递归神经网络的DNase高通量测序数据中DNA碱基倾向性偏差消除方法,步骤一:DNase‑Seq数据酶切位点区域DNA碱基获取,步骤二:DNase‑Seq数据DNA碱基倾向性获取,步骤三:基于深度递归神经网络的DNA碱基组合倾向性模型构建,步骤四:DNA碱基倾向性偏差消除。通过所发明的方法可以精确地滤除DNase高通量测序数据中含有的DNA碱基倾向性偏差,以生成更加准确的DNase‑Seq测序结果,从而为后续更高层次的应用分析提供数据保障。
-
公开(公告)号:CN108280326A
公开(公告)日:2018-07-13
申请号:CN201810057821.7
申请日:2018-01-22
Applicant: 哈尔滨工程大学
IPC: G06F19/22
Abstract: 本发明提供一种基于深度递归神经网络的DNase高通量测序数据中DNA碱基倾向性偏差消除方法,步骤一:DNase-Seq数据酶切位点区域DNA碱基获取,步骤二:DNase-Seq数据DNA碱基倾向性获取,步骤三:基于深度递归神经网络的DNA碱基组合倾向性模型构建,步骤四:DNA碱基倾向性偏差消除。通过所发明的方法可以精确地滤除DNase高通量测序数据中含有的DNA碱基倾向性偏差,以生成更加准确的DNase-Seq测序结果,从而为后续更高层次的应用分析提供数据保障。
-
公开(公告)号:CN105205350B
公开(公告)日:2018-04-17
申请号:CN201510537025.X
申请日:2015-08-28
Applicant: 哈尔滨工程大学
IPC: G06F19/22
Abstract: 本发明属于分子生物信息检测与分析领域,具体涉及一种Ion Torrent测序数据中多聚碱基的长度判定方法。本发明包括:(1)Ion Torrent实验数据的获取与多聚碱基信息提取;(2)基因组基本信息的获取及多聚碱基基本信息的提取;(3)多聚碱基长度已知的电压值贝叶斯先验概率计算;(4)判定基因组基本信息和电压值贝叶斯先验概率的多聚碱基长度并对权值参数优化;(5)多聚碱基长度判定。本发明通过所发明的方法可以高精度地依据Ion Torrent测序得到的检测电压值对该电压值对应的多聚碱基的长度进行判定,以生成更加准确的Ion Torrent测序结果,从而为后续更高层次的应用分析提供数据保障。
-
公开(公告)号:CN105893788A
公开(公告)日:2016-08-24
申请号:CN201610265225.9
申请日:2016-04-26
Applicant: 哈尔滨工程大学
IPC: G06F19/20
CPC classification number: G06F19/20
Abstract: 本发明提供的是一种利用参考基因组信息的半导体测序平台的测序数据校正方法。1)利用半导体测序平台测序数据中检测碱基的解读长度与参考基因组中对应碱基的长度一致时的测得电压值,计算碱基长度已知时测得电压值的先验概率分布;2)当半导体测序平台测序数据中检测碱基的解读长度与参考基因组中对应碱基的长度不一致时,对测序数据的碱基长度进行校正,利用下式计算测得电压值已知时,假定碱基长度为l时的值Sl;取Sl最大时对应的碱基长度l,即为测得电压值已知时被测碱基的碱基长度,完成测序数据校正。本发明创新性地提出测得电压值解算碱基长度的过程中,在测得电压值基础上,引入参考基因组信息,以实现对测序数据的校正。
-
公开(公告)号:CN102622534B
公开(公告)日:2015-09-30
申请号:CN201210104293.9
申请日:2012-04-11
Applicant: 哈尔滨工程大学
IPC: G06F19/20
Abstract: 本发明属于分子生物信息检测领域。具体是一种提高DNA高通测序获取基因表达检测数据准确性的校正方法。该发明包括下列步骤:(1)采集基因表达DNA测序检测数据,建立基因表达DNA高通测序检测数据校正模型;(2)采集基因芯片测量的基因表达值;(3)采用相关分析确定基因表达高通测序校正模型中的模型参数;(4)确定模型参数值后的基因表达DNA高通测序检测数据校正模型生成校正后的基因表达值。本发明利用校正模型对DNA测序值存在的序列比对映射误差进行估算和补偿,减小了检测误差,在充分发挥DNA高通测序检测数据高分辨率、高精度的基础上,有效提高检测的准确性。
-
公开(公告)号:CN102779240B
公开(公告)日:2015-05-20
申请号:CN201210205886.4
申请日:2012-06-21
Applicant: 哈尔滨工程大学
IPC: G06F19/16
Abstract: 本发明提供的是一种基于核典型相关分析的固有不规则蛋白质结构预测方法。(1)提取待预测蛋白质的结构特征和生化特征作为识别特征,所述结构特征指采用窗口法得到的蛋白质预测位点周围氨基酸的组合频率,所述生化特征指蛋白质预测位点氨基酸的Russell/Linding值、疏水性、极性和带电性;(2)采用核典型相关分析法对所提取的特征数据进行映射和融合,获取更有利于蛋白质结构识别的特征数据,核典型相关分析法的核函数采用径向基函数;(3)基于更有利于蛋白质结构识别的特征数据,进行蛋白质结构识别和预测。本发明的预测精度得到有效提高,有助于为固有不规则蛋白质的发现和确认提供前期依据,并为生物制药的研制提供基础。
-
公开(公告)号:CN103390119A
公开(公告)日:2013-11-13
申请号:CN201310277169.7
申请日:2013-07-03
Applicant: 哈尔滨工程大学
IPC: G06F19/12
Abstract: 本发明属于分子生物信息检测领域,具体涉及一种基于条件随机场技术,融合ChIP-chip基因芯片数据和ChIP-seq DNA测序数据的转录因子结合位点识别方法。本发明包括:建立条件随机场模型;获取ChIP-chip实验检测值,识别出对应状态值;获取ChIP-seq实验检测值识别出对应状态值;测试条件随机场模型的识别精度;加权融合识别结果的第n个DNA碱基片段识别概率;比较和识别转录因子结合位点。本发明利用条件随机场融合ChIP-chip和ChIP-seq实验的检测数据识别转录因子结合位点。通过实验验证,在识别准确率方面,本发明方法要高于采用单一技术的识别方法。
-
公开(公告)号:CN102779240A
公开(公告)日:2012-11-14
申请号:CN201210205886.4
申请日:2012-06-21
Applicant: 哈尔滨工程大学
IPC: G06F19/16
Abstract: 本发明提供的是一种基于核典型相关分析的固有不规则蛋白质结构预测方法。(1)提取待预测蛋白质的结构特征和生化特征作为识别特征,所述结构特征指采用窗口法得到的蛋白质预测位点周围氨基酸的组合频率,所述生化特征指蛋白质预测位点氨基酸的Russell/Linding值、疏水性、极性和带电性;(2)采用核典型相关分析法对所提取的特征数据进行映射和融合,获取更有利于蛋白质结构识别的特征数据,核典型相关分析法的核函数采用径向基函数;(3)基于更有利于蛋白质结构识别的特征数据,进行蛋白质结构识别和预测。本发明的预测精度得到有效提高,有助于为固有不规则蛋白质的发现和确认提供前期依据,并为生物制药的研制提供基础。
-
公开(公告)号:CN108197430B
公开(公告)日:2022-04-29
申请号:CN201810057819.X
申请日:2018-01-22
Applicant: 哈尔滨工程大学
Abstract: 本发明提供一种基于迁移学习的功能型microexon识别方法,包括:步骤一、microindels样本标签获取,步骤二、microexon和microindels特征提取,步骤三、基于迁移学习的microexon和microindels特征空间迁移,步骤四、基于迁移学习的功能型microexon识别模型的构建。本发明利用迁移学习,通过对具有样本类别标签的microindels的识别模型,识别功能性microexon。
-
-
-
-
-
-
-
-
-