-
公开(公告)号:CN114627964A
公开(公告)日:2022-06-14
申请号:CN202111069507.9
申请日:2021-09-13
Applicant: 东北林业大学 , 电子科技大学长三角研究院(衢州)
Abstract: 一种基于多核学习预测增强子及其强度分类方法及分类设备,本发明涉及基于多核学习预测增强子及其强度分类方法及分类设备。本发明的目的是为了解决现有方法需要花费大量的人力物力去制备实验所需的试剂,以及通过生物实验注释DNA片段功能,效率低的问题。过程为:获取带标签的DNA测序序列;使用三种特征描述符进行编码转换为向量;分别对得到的向量进行特征筛选获得各自的F值,分别进行降维排序,选出各自对应的最佳的特征子集;计算每个高斯函数对应的最佳权重;构建增强子预测模型;构建强弱增强子预测模型;通过构建好的增强子预测模型和强弱增强子预测模型对待测DNA测序序列进行判断。本发明用于生物信息技术领域。
-
公开(公告)号:CN114627964B
公开(公告)日:2023-03-24
申请号:CN202111069507.9
申请日:2021-09-13
Applicant: 东北林业大学 , 电子科技大学长三角研究院(衢州)
IPC: G16B30/00 , G16B40/20 , G06F18/214 , G06F18/2411 , G06N20/10
Abstract: 一种基于多核学习预测增强子及其强度分类方法及分类设备,本发明涉及基于多核学习预测增强子及其强度分类方法及分类设备。本发明的目的是为了解决现有方法需要花费大量的人力物力去制备实验所需的试剂,以及通过生物实验注释DNA片段功能,效率低的问题。过程为:获取带标签的DNA测序序列;使用三种特征描述符进行编码转换为向量;分别对得到的向量进行特征筛选获得各自的F值,分别进行降维排序,选出各自对应的最佳的特征子集;计算每个高斯函数对应的最佳权重;构建增强子预测模型;构建强弱增强子预测模型;通过构建好的增强子预测模型和强弱增强子预测模型对待测DNA测序序列进行判断。本发明用于生物信息技术领域。
-
公开(公告)号:CN120032725A
公开(公告)日:2025-05-23
申请号:CN202510495859.2
申请日:2025-04-21
Applicant: 电子科技大学长三角研究院(衢州)
IPC: G16B40/20 , G16B25/10 , G16B30/10 , G06F18/213 , G06F18/243 , G06N3/0464 , G06N3/084 , G06N3/09 , G06N3/0985
Abstract: 本发明公开了一种基于转录因子基序预测scATAC‑seq中启动子片段的分类方法,它解决了现有技术中通过多组学整合来确定启动子的方式繁琐且效率低的问题。它包括通过分析同一组织中的多种组学数据,接着通过RNA表达量分析,筛选出前2000个高变基因。然后利用基因ID确定这些基因是否具有对应的RNA表达量,并找到这些基因的转录起始位点TSS处的scATAC‑seq序列,同时区分出非启动子区域的序列,并将启动子区域的序列分割成100bp的片段,以便进行后续的特征提取。随后利用motif特征对这些片段进行特征提取,建立预测模型,用于预测启动子区域。最后对预测模型进行评估,确保其具有良好的预测性能和准确性。本发明的优点在于:能够通过学习多组学数据可以准确快速的识别启动子区域。
-
-