-
公开(公告)号:CN119207547B
公开(公告)日:2025-05-09
申请号:CN202411710162.4
申请日:2024-11-27
Applicant: 电子科技大学长三角研究院(衢州)
Abstract: 本发明公开了一种基于鲁棒多核集成方法的药物靶点交互预测方法及其系统,该方法包括,构建目标函数,包括关于预测交互矩阵的损失函数,集成学习项和正则项;以已知交互矩阵、药物相似核矩阵集合和靶点相似核矩阵集合为训练数据训练模型以优化所述的目标函数;所述药物相似核矩阵集合包含待测药物,靶点相似核矩阵集合包含待测靶点;训练结束后,模型输出包含待测药物与待测靶点交互置信度的预测交互矩阵。本方案模型利用多核学习、多视角信息融合以及集成学习策略,结合鲁棒损失函数,通过训练在药物‑靶点相互作用矩阵进行重建,可通过对未知药物‑靶点相互作用的预测,扩展已有的药物靶标数据库。
-
公开(公告)号:CN119028427A
公开(公告)日:2024-11-26
申请号:CN202410914418.7
申请日:2024-07-09
Applicant: 电子科技大学长三角研究院(衢州)
IPC: G16B15/30 , G16B40/00 , G06N3/0464 , G06N3/0499 , G06N3/048 , G06N3/08
Abstract: 本发明涉及一种预测药物靶标关联关系的方法。它解决了现有技术中药物靶标关联预测方法预测准确度不佳的问题。它包括S1、收集并下载药物和蛋白质结构数据以及关联的交互网络;S2、药物和蛋白质结构数据处理,转换交互网络;S3、从结构数据提取并学习药物结构特征和蛋白质的结构特征;S4、设计协同对比学习策略,计算对比学习损失;S5、设计自适应自步采样策略,获得高可靠度的对比学习样本对;S6、获取药物和蛋白质的最终特征表示,利用MLP预测潜在的药物‑靶标(蛋白质)的交互关系。本发明的优点在于:能够更充分地利用多种交互网络之间的互补性知识,从每个交互网络中学习到一致性更高的特征表示,进而提高药物‑靶标关联关系的预测准确度。
-
公开(公告)号:CN118229620A
公开(公告)日:2024-06-21
申请号:CN202410157763.0
申请日:2024-02-04
Applicant: 电子科技大学长三角研究院(衢州)
Abstract: 基于功能性磁共振成像数据的状态转移概率分布特征提取方法及阿尔茨海默症识别方法,属于脑神经科学技术领域,为了解决现有的阿尔茨海默病诊断方法忽略了局部特异性和时序非平稳性,从而导致识别准确率不佳的问题。本发明首先将一个功能性磁共振成像的数据定义为多变量时间序列数据Ak,并将样本的时间序列数据中的每一个时间片#imgabs0#映射为状态u;然后进行多尺度状态转移概率分布统计,提取到单个脑区状态转移的离散概率分布。然后通过詹森‑香农散度来衡量两个样本之间脑区状态转移概率分布的相似度,进而实现阿尔茨海默症的识别。
-
公开(公告)号:CN117649885A
公开(公告)日:2024-03-05
申请号:CN202311532360.1
申请日:2023-11-16
Applicant: 电子科技大学长三角研究院(衢州)
IPC: G16B40/20 , G16B40/30 , G06N3/0464 , G06N3/088 , G06N3/09 , G06F18/213 , G06F18/25
Abstract: 本方案公开了一种识别c ircRNA蛋白结合位点的新方法,该方法提出利用三种特征提取技术实现针对序列的多种编码特征,由跨视图预测和微调两部分构成预测模型,利用其中两种编码特征对预测模型进行无监督的跨视图预测以训练预测模型的上下文提取能力,同时进一步利用全部三种特征提取技术基于有标签样本得到的融合编码特征对预测模型进行微调,最终实现通过少量带标签样本实现具有c ircRNA蛋白结合位点识别能力且具有更佳的综合能力、更高的预测性能的预测模型。
-
公开(公告)号:CN117198396A
公开(公告)日:2023-12-08
申请号:CN202311011172.4
申请日:2023-08-11
Applicant: 电子科技大学长三角研究院(衢州)
IPC: G16B20/30 , G16B40/00 , G06F18/213 , G06F18/24 , G06F18/25 , G06F18/214 , G06F18/243 , G06N20/20
Abstract: 本方案公开了一种鉴定RNA假尿苷位点的新方法,该方法提出使用多种特征表示技术来提取序列特征,然后利用SVM‑RFE方法进行特征选择来压缩特征空间,优化特征子集,将经过特征选择后的最佳特征集输入到基于多项式随机森林的核方法KeMRF中识别序列中的假尿苷位点。KeMRF作为一种新提出的分类方法,与传统的随机森林相比,其不仅优化了节点分裂的判别准则,同时结合易于解释的核方法,使得分类性能更加优越。该方法减少了模型的训练时间,同时提高了模型的分类性能,也进一步提升了对假尿苷位点识别的准确率。
-
公开(公告)号:CN115798568A
公开(公告)日:2023-03-14
申请号:CN202211444626.2
申请日:2022-11-18
Applicant: 电子科技大学长三角研究院(衢州)
Abstract: 本发明提供了一种预测microRNA和疾病关联的模型的训练方法,将microRNA和疾病的关联的样本集,输入链路传播网络进行训练,得到目标预测microRNA和疾病关联的模型。本发明解决了现有技术中存在的模型预测精确度不高的问题,利用链路传播原理,如果某一个节点和另一个节点的相似度较高,那么这个节点代表的microRNA和疾病的关联就可以被传播到另一个节点中,从而使得预测更加准确。
-
公开(公告)号:CN113838529A
公开(公告)日:2021-12-24
申请号:CN202111138368.0
申请日:2021-09-27
Applicant: 电子科技大学长三角研究院(衢州)
Abstract: 本发明提供一种植物中sgRNA活性预测方法及装置,方法包括:下载sgRNA活性序列数据集,sgRNA活性序列数据集包括植物sgRNA活性数据;采用热编码方法对植物sgRNA活性数据进行编码,得到植物sgRNA序列数据;采用k‑mer编码方法对植物sgRNA序列数据进行二次编码;通过编码后的sgRNA活性序列数据集构建卷积神经网络模型;通过卷积神经网络模型按设定次数n分别对编码后的sgRNA活性序列数据集进行预测训练,得到n个训练模型,将n个训练模型集成,得到卷积神经网络预测模型sgRNACNN;将待预测的植物sgRNA活性序列输入卷积神经网络预测模型sgRNACNN中,得到预测结果。本发明的卷积神经网络预测模型sgRNACNN泛化性能较好,可应用于多物种植物sgRNA活性预测,能够实现对sgRNA活性的准确识别,具有较好的实用性能。
-
公开(公告)号:CN119360952A
公开(公告)日:2025-01-24
申请号:CN202411921316.4
申请日:2024-12-25
Applicant: 电子科技大学长三角研究院(衢州)
IPC: G16B15/30 , G16B40/00 , G06N3/0455 , G06N3/042
Abstract: 本发明公开了一种基于图Transformer的蛋白质‑配体对接打分模型的构建方法,包括图神经网络、基于注意力机制的多层网络和解码模块,解码模块包括MND解码模块和pKd解码模块;MND解码模块用于计算蛋白质和配体之间距离概率分布;pKd解码模块用于预测蛋白质和配体结合时的亲和力值;损失函数包括MDN损失和pKd损失,多层网络的第一层具有随着训练迭代更新的用于指示特征被保留或屏蔽的掩码向量,以蛋白质图和配体图为输入进行对接打分预测。本方案模型同时使用了MDN和pKd两个解码模块,MDN从概率分布的角度优化模型参数,而pKd模块则从结合亲和力的角度来优化模型参数,两者分别从空间关系和相互作用关系来进行对接打分,通过两者的配合可有效提升模型的综合评价能力。
-
公开(公告)号:CN117953973A
公开(公告)日:2024-04-30
申请号:CN202410326309.3
申请日:2024-03-21
Applicant: 电子科技大学长三角研究院(衢州)
Abstract: 本发明提供了一种基于序列同源性的特定生物序列预测方法及其系统,包括,准备特定生物序列相关的原始序列数据集;原始序列数据集包括训练集和测试集,训练集用于训练模型,测试集则用于对训练的模型进行测试;构造基于序列同源性评分的模糊隶属函数,用于将序列数据转化成特征向量;构造深度模糊回声状态网络,用于根据特征向量输出预测结果;使用原始序列数据集训练深度模糊回声状态网络。本方案提出基于序列同源性评分的模糊隶属函数将序列数据转化成特征向量,无需手动提取特征,并且可直接处理字符串序列,无需进行特征编码,通过整合序列进化信息有效优化特征空间,不仅减少了模型的训练时间,同时提高了模型的分类性能。
-
公开(公告)号:CN117437983A
公开(公告)日:2024-01-23
申请号:CN202311471325.3
申请日:2023-11-07
Applicant: 电子科技大学长三角研究院(衢州)
IPC: G16B40/00 , G16B30/10 , G16B20/30 , G06F18/213 , G06F18/2415
Abstract: 本发明提供一种GPCR蛋白序列的识别方法及计算机可读存储介质,包括:获取待识别的GPCR蛋白序列,使用PsePSSM提取方法提取蛋白序列的GPCR特征;将所述GPCR特征输入预先训练完成的MLapRVFL分类模型中,得到所述MLapRVFL分类模型输出的识别结果,其中,所述MLapRVFL分类模型是通过将多拉普拉斯和L2,1‑norm正则化项引入基本的随机向量功能链接RVFL方法中进行训练得到的,且所述MLapRVFL分类模型根据Spec、ACC、SN、MCC、AUC至少五个衡量指标衡量MLapRVFL分类模型的准确度,根据实验结果显示,PsePSSM特征提取方法相对于其他特征提取方法在MLapRVFL分类模型上的ACC、AUC衡量指标上能获得了更好的分类效果,本发明相比现有的机器学习方法在GPCR数据集上也有更好的分类性能,且提高了GPCR蛋白质序列的预测准确性。
-
-
-
-
-
-
-
-
-