-
公开(公告)号:CN119132389A
公开(公告)日:2024-12-13
申请号:CN202411113195.0
申请日:2024-08-14
Applicant: 东北林业大学
Abstract: 本发明提出一种单细胞测序数据的生成方法,包括:S1:构建深度神经网络模型;S2:获取scRNA‑seq综合数据集;S3、对所述scRNA‑seq综合数据集进行预处理;S4:基于预处理后的scRNA‑seq综合数据集对深度神经网络模型进行训练;S5:基于训练后的深度神经网络模型对待测数据的特征进行加噪、去噪和重构,生成单细胞测序数据。本发明在多种测序平台的数据集上,深度神经网络模型都能生成高质量的scRNA‑seq数据。通过与其它最新的数据生成模型进行比较深度神经网络模型在多个评价指标上均表现出更优秀的性能。此外,深度神经网络模型还能够模拟伪时间尺度下的单细胞数据,为追踪细胞分化和发育轨迹、分析细胞间的通讯、揭示细胞的异质性等分析提供高质量的数据支持。
-
公开(公告)号:CN118711670A
公开(公告)日:2024-09-27
申请号:CN202410707776.0
申请日:2024-06-03
Applicant: 东北林业大学
IPC: G16B40/00 , G16B45/00 , G16B25/10 , G06F18/214 , G06F18/243
Abstract: 基于生物大数据的神经退行性疾病分类系统,本发明属于生物信息学领域。具体涉及基于生物大数据的神经退行性疾病分类系统。本发明的目的是为了解决现有的大数据分析工具在针对神经退行性疾病的分类准确性和可靠性差的问题。基于生物大数据的神经退行性疾病分类系统包括:数据采集模块、程序性细胞死亡lncRNA打分模块、lncRNA与程序性细胞死亡的相关性评估模块、程序性细胞死亡基因优化模块、随机森林分类器模块、待测模块;随机森林分类器模块用于基于程序性细胞死亡基因优化模块获得的与程序性细胞死亡显著相关的mRNA获得训练好的随机森林分类器;待测模块用于基于训练好的随机森林分类器对待测神经退行性疾病的mRNA数据进行分类。
-
公开(公告)号:CN117637019A
公开(公告)日:2024-03-01
申请号:CN202311657851.9
申请日:2023-12-06
Applicant: 东北林业大学
Abstract: 药物‑miRNA关联预测是药物开发领域重要的前沿研究问题。传统的方法首先根据先验的药物‑miRNA关联数据构建异构网络,再通过分析药物‑miRNA异构网络中的节点特征和拓扑关系进行药物‑miRNA关联预测。然而,先验的药物‑miRNA关联数据比较稀疏并且噪声较多,严重影响药物‑miRNA关联预测方法的准确率。针对这一问题,本发明提出了一种基于多通道稀疏处理的药物‑miRNA关联预测方法。首先,运用矩阵分解、有界核范数计算与图神经网络等多种方法构建多个数据处理通道;然后,利用上述数据处理通道分别对先验数据进行数据增强和降噪处理;最后,采用贝叶斯优化算法融合多通道数据并预测药物‑miRNA关联关系。本发明所提出的方法能够有效地提升药物‑miRNA关联预测的准确率,为深入挖掘药物与miRNA之间的潜在关联关系提供更加有效的工具。
-
公开(公告)号:CN117059175A
公开(公告)日:2023-11-14
申请号:CN202311031740.7
申请日:2023-08-16
Applicant: 东北林业大学
IPC: G16B40/30 , G06F18/214 , G06F18/25 , G06N3/0464 , G06N3/0455 , G06N3/048 , G06N3/088 , G16B15/30
Abstract: 一种细胞特异性沉默子及其强度的识别方法,涉及生物信息技术领域,针对现有技术中单纯依赖沉默子序列的识别方法识别沉默子的准确率低的问题,本申请有效提高了识别特定细胞中沉默子的准确率,并且优于现有的识别沉默子方法,gkm‑SVM方法、DeepSilencer方法和SEPredict方法。同时,本申请首次提出基于多组学数据的复杂深度学习框架识别强沉默子和弱沉默子,并在独立测试集上取得较高的准确率。此外,本申请进一步分析了深度学习捕捉的与沉默子强相关的生物学组合信号。
-
公开(公告)号:CN116959562A
公开(公告)日:2023-10-27
申请号:CN202310852512.X
申请日:2023-07-12
Applicant: 东北林业大学
IPC: G16B20/30 , G16B45/00 , G06F18/2413
Abstract: 一种识别疾病表型相关的细胞亚群的方法,属于生物医学领域。为识别疾病表型相关的细胞亚群,本发明收集疾病的单细胞RNA测序数据得到单细胞表达矩阵,收集疾病的bulk表达矩阵和对应的表型标签,下载人类蛋白质相互作用数据构建蛋白质相互作用网络;提取细胞和样本的基因特征签名映射到蛋白质相互作用网络中形成相应的细胞模块、样本模块;计算每个细胞模块和每个样本模块之间的距离,确定多个样本模块的集合作为疾病表型的样本模块集合;计算细胞模块与疾病表型的样本模块集合之间的距离;创建背景距离分布评估细胞模块与疾病表型的样本模块集合间距离的统计显著性,并确定与疾病表型的样本模块集合距离显著小于背景距离分布的细胞。
-
公开(公告)号:CN116805508A
公开(公告)日:2023-09-26
申请号:CN202310288886.3
申请日:2023-03-22
Applicant: 东北林业大学
IPC: G16B20/00 , G16B40/00 , G06N3/0442 , G06N3/084
Abstract: 一种组织特异性eRNA的识别方法,具体涉及一种基于深度学习的组织特异性eRNA的识别方法,为解决eRNA识别方法仅依赖eRNA的序列特征进行识别,导致识别结果的准确率不高的问题。它包括获取某组织的eRNA数据集和非增强子数据集,以及此组织不同年龄样本的多种组蛋白修饰数据;提取每个eRNA和每个非增强子的序列特征,以及每个eRNA和每个非增强子在不同年龄样本下的每种组蛋白修饰特征;合并此组织中所有eRNA和非增强子在每个年龄样本下的多种组蛋白修饰特征,利用聚类和投票得到此组织的RE和AE,将RE和AE加入此组织中不同年龄样本的组蛋白修饰特征,通过深度神经网络模型识别组织特异性eRNA。属于生物信息学领域。
-
公开(公告)号:CN116343909A
公开(公告)日:2023-06-27
申请号:CN202310228158.3
申请日:2023-03-10
Applicant: 东北林业大学
Abstract: 本发明公开了一种基于深度图神经网络的药物‑疾病关联预测方法,包括:得到药物和疾病的多源特征数据以及药物‑疾病的原始关联矩阵;采用高斯核函数分别构建药物和疾病的相似性矩阵,对原始关联矩阵进行随机游走;分别将药物和疾病的相似性矩阵输入至两个独立的图神经网络中进行监督学习,提取药物和疾病的特征表示;利用矩阵整合药物和疾病的特征表示,得到本次的药物‑疾病预测关联矩阵;将本次的药物‑疾病预测关联矩阵代替随机游走后的药物‑疾病关联矩阵,使两个图神经网络重复进行上述监督学习,直至满足预设优化目标,得到最终的预测模型。本发明可更好的获取药物与疾病之间的相互作用信息,提高潜在的药物‑疾病关联预测精度。
-
公开(公告)号:CN116259363A
公开(公告)日:2023-06-13
申请号:CN202310255871.7
申请日:2023-03-16
Applicant: 东北林业大学
Abstract: 一种基于深度学习的植物抗旱基因的识别方法,为了解决现有的植物抗旱基因识别方法耗时长,成本大或过度依赖序列同源性,导致预测结果准确率低的问题。它包括以下步骤:首先获取不同植物的氨基酸序列及其对应的样本标签,样本标签为是否具有抗旱基因;将每条氨基酸序列分为多个长度为2的kmer,根据kmer提取每条氨基酸序列的特征;构建的BiLSTM‑Attention模型依次包括输入层、词嵌入层、特征提取层、注意力层和输出层,将每条氨基酸序列的特征输入BiLSTM‑Attention模型中进行训练,输出所述氨基酸序列是否具有抗旱基因。属于基因识别领域。
-
公开(公告)号:CN114627964A
公开(公告)日:2022-06-14
申请号:CN202111069507.9
申请日:2021-09-13
Applicant: 东北林业大学 , 电子科技大学长三角研究院(衢州)
Abstract: 一种基于多核学习预测增强子及其强度分类方法及分类设备,本发明涉及基于多核学习预测增强子及其强度分类方法及分类设备。本发明的目的是为了解决现有方法需要花费大量的人力物力去制备实验所需的试剂,以及通过生物实验注释DNA片段功能,效率低的问题。过程为:获取带标签的DNA测序序列;使用三种特征描述符进行编码转换为向量;分别对得到的向量进行特征筛选获得各自的F值,分别进行降维排序,选出各自对应的最佳的特征子集;计算每个高斯函数对应的最佳权重;构建增强子预测模型;构建强弱增强子预测模型;通过构建好的增强子预测模型和强弱增强子预测模型对待测DNA测序序列进行判断。本发明用于生物信息技术领域。
-
公开(公告)号:CN113764045A
公开(公告)日:2021-12-07
申请号:CN202111056316.9
申请日:2021-09-09
Applicant: 东北林业大学 , 电子科技大学长三角研究院(衢州)
Abstract: 基于XGboost算法的DNA结合蛋白识别方法、系统、存储介质及设备,属于计算机与蛋白质识别结合技术领域。本发明为了解决现有的DNA结合蛋白识别方法存在不能兼顾通用性和识别准确率的问题。本发明利用DNA结合蛋白识别分类器对待识别的DNA结合蛋白进行识别;DNA结合蛋白识别分类器的确定过程中,首先获取处理的DNA结合蛋白特征数据集;采用不同的提取算法提取DNA结合蛋白数据集的数据特征,得到多个特征文件;并将不同特征提取算法提取的序列特征矩阵拼接起来,得到拼接后的特征矩阵;然后对生成的特征矩阵进行规范化处理,使用MRMD算法矩阵进行降维处理;最后使用XGboost算法构建并训练DNA结合蛋白识别分类器模型。主要用于DNA结合蛋白的识别。
-
-
-
-
-
-
-
-
-