-
公开(公告)号:CN119811504A
公开(公告)日:2025-04-11
申请号:CN202411931012.6
申请日:2024-12-26
Applicant: 桂林电子科技大学
IPC: G16B40/00 , G16B5/00 , G16B30/00 , G06N3/0455 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种识别DNA序列中超级增强子与典型增强子的预测方法,采用整数编码和k‑mer编码方案进行编码,使用残差连接的卷积神经网络提取序列的局部特征,使用两个双向长短期记忆网络提取序列的多尺度全局特征。利用注意力机制将这些局部特征和全局特征进行特征融合,然后输入到全连接神经网络中得到预测概率。采用五折交叉验证的评估方式对模型性能进行评估,使用准确率(ACC)、召回率(REC)、精度(PRE)、F1分数(F1)、ROC曲线下面积(AUC)等五个评估指标衡量模型;独立测试集上的实验结果表明,相比于最先进的方法,我们的模型在识别超级增强子与典型增强子上有了显著的性能提升。
-
公开(公告)号:CN119786038A
公开(公告)日:2025-04-08
申请号:CN202411930976.9
申请日:2024-12-26
Applicant: 桂林电子科技大学
IPC: G16H50/30 , G16H30/40 , G06T7/11 , G06T5/70 , G06T5/60 , G06V10/82 , G06V10/80 , G06N3/0455 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于文字‑3D图像的多模态脑卒中预测方法,其过程包含如下步骤:收集样本数据和预处理:获取脑卒中患者MRI样本以及每个样本病灶区域的自然语言描述信息,并将文字描述转换为向量表示,作为后续模型的输入;构建模型:使用卷积神经网络(CNN)作为图像特征编码模块,均采用U‑Net架构。模型优化:我们采用Soft Dice Loss和Cross Entropy Loss两个的加权作为模型的损失函数,以更好地优化模型;多模态融合:我们利用Transformer结构将视觉和语言信息进行融合,实现跨模态特征的深度交互;模型评估:使用Dice系数、精确度、召回率、HD95共4个评价指标来评估分割模型的性能。通过对比模型在不同评估指标下的表现,不断优化分割结果。
-
公开(公告)号:CN119763652A
公开(公告)日:2025-04-04
申请号:CN202411931086.X
申请日:2024-12-26
Applicant: 桂林电子科技大学
IPC: G16B15/30 , G16B30/00 , G16B40/00 , G16C20/50 , G16C20/70 , G06N3/042 , G06N3/0464 , G06N3/0895 , G06N3/09
Abstract: 本发明公开了一种基于多层次对比学习和等变图神经网络的药物靶点亲和力预测方法MLC‑DTA。该方法将预测问题转化为多层次(分子层次、网络层次)分子图的回归问题,利用AlphaFold2和RDKit分别获取蛋白质分子和药物分子的三维坐标,并分别通过等变图神经网络从分子层次捕获信息。药物靶点亲和力关系图则采用图卷积网络从网络层次捕获信息。这些多层次图嵌入经过对比学习策略后得到更具代表性的特征,最终通过MLP多层感知机输出预测回归值。MLC‑DTA模型在两个经典数据集上进行了预测,并通过Grid Search优化参数。划分训练集和测试集对模型性能进行评估,使用均方误差、一致性指数和回归趋向均值三个评估指标衡量模型性能。案例分析验证了模型的泛化能力,相比于最先进的方法,MLC‑DTA有了显著的性能提升。
-
公开(公告)号:CN118824353A
公开(公告)日:2024-10-22
申请号:CN202410923888.X
申请日:2024-07-11
Applicant: 桂林电子科技大学
IPC: G16B15/30 , G16B40/00 , G16B15/00 , G06F18/213 , G06F18/241 , G06F18/25 , G06F18/21 , G06N3/045 , G06N3/042 , G06N3/0464 , G06N3/0499 , G06N3/08
Abstract: 本发明公开了一种多视图图嵌入融合的蛋白质‑DNA结合位点预测方法EGPDI,利用蛋白质结构生成模型AlphaFold2获取蛋白质结构,整合蛋白质序列构成数据集;将蛋白质‑DNA结合位点问题转换为图节点分类问题;使用预训练的蛋白质语言模型(pLMs)生成嵌入和手工设计的特征共同构成图的节点特征编码;基于蛋白质的3D结构信息设计图的边特征编码;采用等变图神经网络和图卷积网络从不同的视图角度捕获信息;使用搭建的EGPDI模型对数据集进行预测,并采用Grid Search超参数优化对模型进行参数优化;采用五折交叉验证的评估方式对模型性能进行评估,使用特异性、精确率、召回率、F1‑score和马修斯相关系数,五个评估指标衡量模型;采用独立测试和案例分析进行模型泛化能力的验证,相比于最先进的方法,EGPDI有了显著的性能提升。
-
公开(公告)号:CN118800331A
公开(公告)日:2024-10-18
申请号:CN202410993153.4
申请日:2024-07-24
Applicant: 桂林电子科技大学
IPC: G16B30/00 , G16B40/00 , G06N3/0442 , G06N3/048 , G06N3/0464 , G06F18/24 , G06N3/049
Abstract: 本发明公开了一种度学习模型结合核苷酸化学性质对于ncRNA家族的预测方法,使用的是公共数据库Rfam中的数据集,利用计算核苷酸化学性质与核苷酸密度的方法NCP‑ND对核苷酸序列数据进行编码,使用多尺度注意力机制(MSA)对初始特征向量进行加权,再使用Bi‑LSTM捕获核苷酸序列的上下文特征,进而使用DenseNet来提取核苷酸序列的全局特征,最后通过全连接网络进行多分类;通过正则化等技术来防止模型过拟合,使用十折交叉验证以及独立测试集来对模型进行性能测试。该方法使用NCP‑ND进行特征编码,不需要生物学的先验知识,利用深度学习的计算方法提高了ncRNA家族预测的准确率。
-
公开(公告)号:CN119763670A
公开(公告)日:2025-04-04
申请号:CN202411931046.5
申请日:2024-12-26
Applicant: 桂林电子科技大学
IPC: G16B40/00 , G16B50/00 , G16B30/00 , G06N3/042 , G06N3/0464 , G06N3/0455 , G06N3/084
Abstract: 本发明公开了一种基于深度学习模型对于ncRNA与蛋白质相互作用的预测方法,使用的是公共数据库四个数据集(RPI488,NPInter2.0,RPI1807,RPI7317),kmer编码策略对ncRNA和蛋白质的序列进行提取高维稀疏特征后,通过Embedding层将稀疏特征映射为低维稠密向量;使用ResNet结合SE注意力机制提取关键的局部特征;随后通过Transformer利用位置编码和多头注意力捕捉长程依赖并提取全局特征;最终,将ResNet和Transformer的特征与线性变换后的蛋白质特征拼接,并通过DNN层进一步提炼特征后使用Sigmoid激活函数输出分类概率。通过正则化等技术来防止模型过拟合,使用十折交叉验证以及独立测试集来对模型进行性能测试。该方法使用k‑mer进行特征编码,不需要生物学的先验知识,并且通过局部特征提取与全局特征建模相结合的方式,充分捕获序列中的关键信息,利用深度学习的计算方法提高了预测ncRNA与蛋白质相互作用的准确率。
-
公开(公告)号:CN118942544A
公开(公告)日:2024-11-12
申请号:CN202410992982.0
申请日:2024-07-24
Applicant: 桂林电子科技大学
Abstract: 本发明公开了一种识别DNA序列中增强子及其活性强度的预测方法,采用独热编码(One‑hot)和核苷酸化学性质(NCP)进行编码。使用改善的密集连接网络(Dense Net)从原始的特征编码中提取高级特征;利用自注意力模块对高级特征的重要性进行评估,然后输入到全连接神经网络中得到预测概率;采用五折交叉验证的评估方式对模型性能进行评估,通过投票对最终分类结果进行集成学习;使用灵敏度(Sn)、特异性(Sp)、准确度(Acc)、马修斯相关系数(MCC)和ROC曲线下面积(AUC)等五个评估指标衡量模型;采用独立测试和进行模型预测能力的验证,相比于最先进的方法,我们的模型在识别增强子及其强度上有了显著的性能提升。
-
-
-
-
-
-