-
公开(公告)号:CN117935927A
公开(公告)日:2024-04-26
申请号:CN202311653122.6
申请日:2023-12-05
Applicant: 电子科技大学长三角研究院(衢州)
Abstract: 本发明提供了一种黏连蛋白介导的细胞特异性染色质环的预测方法,包括:S1.获取多组染色质样本,每组染色质样本包含一正样本和一负样本,每组正负样本组合具有同一对目标位点,正样本的该对目标位点在其细胞系中形成环,负样本未形成环;S2.对染色质样本提取染色质状态特征得到染色质状态后验概率矩阵;对染色质样本提取ChIP‑seq峰数据;将峰数据与染色质状态后验概率矩阵作为输入特征;S3.将输入特征输入预测模型以训练预测模型。实现了一种专门针对细胞特异性的染色质环的预测方法,基于表观修饰组学数据提取特征作为输入,仅需少量组蛋白修饰数据即可,最终使用随机森林算法实现精确预测同一对基因组位点间是否能形成染色质环。
-
公开(公告)号:CN117831638A
公开(公告)日:2024-04-05
申请号:CN202410020804.1
申请日:2024-01-04
Applicant: 电子科技大学长三角研究院(衢州)
IPC: G16B40/20 , G16B20/30 , G06N3/042 , G06N3/043 , G06N3/044 , G06N3/0495 , G06N3/0985 , G06N5/048 , G06F18/2132 , G06F18/2136 , G06F18/241
Abstract: 本发明涉及生物信息学技术领域,尤其涉及一种鉴定DNA N6‑甲基腺嘌呤位点的深度模糊神经网络方法。该鉴定DNA N6‑甲基腺嘌呤位点的深度模糊神经网络方法,包括如下步骤:收集并下载原始序列数据集;基于获取的原始序列数据集,使用特征提取方法将序列数据转化为特征向量,得到特征集;将模糊层次回声状态分类模型作为分类器模型,利用网格搜索法和5折交叉验证方法确定模型的最优参数;采用训练好的分类模型构建DNAN6‑甲基腺嘌呤位点识别器,并将最佳特征集输入识别器中,完成对DNAN6‑甲基腺嘌呤位点的识别。本发明逐层挖掘和捕获隐藏特征,同时结合易于解释的模糊推理系统,分类性能更加优越,进一步提高了N6‑甲基腺嘌呤位点识别的准确率。
-
公开(公告)号:CN117659052A
公开(公告)日:2024-03-08
申请号:CN202311428208.9
申请日:2023-10-31
Applicant: 电子科技大学长三角研究院(衢州)
IPC: C07D519/00 , A61K31/4985 , A61P31/14 , G16C20/50
Abstract: 本发明属于设计药学和冠状病毒感染药物领域,公开了一种抗新型冠状病毒的二酮哌嗪生物碱类化合物及其应用,该发明通过采用分子动力学模拟的方式对多个主蛋白酶体系进行拟合,根据打分函数,结合能计算和RMSD数值等多个维度与参照化合物对比分析出1种化合物具有抗新型冠状病毒的活性。本发明不仅提供了新的化合物,也为未来的药物设计提供了有效的方法论。通过采用分子动力学模拟,结合能计算和RMSD数值等多个维度进行药物设计,这为药品研发领域带来了新的可能。
-
公开(公告)号:CN116343915A
公开(公告)日:2023-06-27
申请号:CN202310249336.0
申请日:2023-03-15
Applicant: 电子科技大学长三角研究院(衢州)
IPC: G16B20/20 , G06F18/241 , G06F18/25 , G06F18/214 , G16B50/00
Abstract: 本方案公开了一种生物序列集成分类器的构建方法及生物序列预测分类方法,首先通过多序列比对技术构建序列核,通过表征生物序列之间的距离构建结构核,通过本体论的的标注,在树形结构上估算生物序列之间的距离来构建功能核;然后使用不同的多核学习方法求解核权重,使用多核融合技术融合序列核、功能核和结构核,基于序列核、结构核、功能核构建及训练相应的基分类器并集成为生物序列集成分类器,完成对生物序列的分类,针对生物序列的特殊性,从序列、结构和功能三维层面学习训练样本之间的距离关系,创新地提出“序列核”、“结构核”和“功能核”,直接处理生物序列样本,避免了数值特征提取时造成的信息丢失与信息冗余。
-
公开(公告)号:CN116110493B
公开(公告)日:2023-06-20
申请号:CN202310267142.3
申请日:2023-03-20
Applicant: 电子科技大学长三角研究院(衢州)
Abstract: 本方案公开了一种用于G‑四链体预测模型的数据集构建方法及其预测方法,该方法提出了一种全新的数据集构建方法,通过所提出的数据集构建方法能够得到一个分辨率、信噪比更高,数据更加清晰、真实的数据集来对模型进行训练,为G4训练数据集的构建提出了新的思路,使得模型的预测性能得到提升,同时,本方法考虑了DNA的链特异性,区分了G‑四链体在DNA不同链上的结构,使得数据集更加真实可靠,进而使得模型的预测效果得到有效提升。
-
公开(公告)号:CN116110493A
公开(公告)日:2023-05-12
申请号:CN202310267142.3
申请日:2023-03-20
Applicant: 电子科技大学长三角研究院(衢州)
Abstract: 本方案公开了一种用于G‑四链体预测模型的数据集构建方法及其预测方法,该方法提出了一种全新的数据集构建方法,通过所提出的数据集构建方法能够得到一个分辨率、信噪比更高,数据更加清晰、真实的数据集来对模型进行训练,为G4训练数据集的构建提出了新的思路,使得模型的预测性能得到提升,同时,本方法考虑了DNA的链特异性,区分了G‑四链体在DNA不同链上的结构,使得数据集更加真实可靠,进而使得模型的预测效果得到有效提升。
-
公开(公告)号:CN115240199A
公开(公告)日:2022-10-25
申请号:CN202210868215.X
申请日:2022-07-22
Applicant: 电子科技大学长三角研究院(衢州)
IPC: G06V30/14 , G06V30/148 , G06V30/19
Abstract: 超声机图像外接预处理系统,涉及一种超声机图像外接预处理系统。本发明为了解决目前手动截取图像的超声区域的方式存在效率低、工作量大的问题。本发明包括通过接口获得病人的超声图像的超声图像获取单元,根据用户选择的配置版信息并调取与各种型号超声机对应的配置文件的配置单元,以及图像处理单元;图像处理单元包括根据配置文件分析标尺图形或字符串型深度信息并得到当前超声影像的深度信息的深度识别模块,基于深度信息并根据配置文件将超声图片中的超声区域分割出来的超声区域分割模块,以及根据配置文件确定当前处理图像中字符串型信息的位置并识别打在超声图像中字符串型信息的字符串识别模块。本发明用于超声机图像的自动处理。
-
公开(公告)号:CN115206435A
公开(公告)日:2022-10-18
申请号:CN202210900280.6
申请日:2022-07-28
Applicant: 电子科技大学长三角研究院(衢州)
Abstract: 本发明公开了一种蛋白预测模型训练方法,以解决现存蛋白质序列的分类识别精度不够的技术问题。该模型包括:获取目标蛋白序列的样本集;根据理化性质对所述样本集进行序列特征提取,得到序列特征集;根据Smote方法对所述序列特征集分别进行平衡,得到平衡特征集;将所述平衡特征集导入分类机GHKNN(Graph regularized k‑local hyperplane distance nearest neighbormodel)进行训练,得到目标蛋白预测模型。该模型提高了蛋白预测模型识别精度。
-
公开(公告)号:CN113764043B
公开(公告)日:2022-05-20
申请号:CN202111063261.4
申请日:2021-09-10
Applicant: 东北林业大学 , 电子科技大学长三角研究院(衢州)
Abstract: 基于位置特异性得分矩阵的囊泡转运蛋白识别方法及识别设备,本发明涉及囊泡转运蛋白识别方法及识别设备。本发明的目的是为了解决现有囊泡转运蛋白的识别方法效率低、成本高的问题。过程为:S1、获取蛋白序列数据文件;S2、基于S1生成位置特异性得分矩阵,并采用AATP算法从位置特异性得分矩阵中提取特征向量;S3、使用不平衡处理算法得到处理后的特征向量;S4、采用MRMD算法得到特征向量集合;S5、采用XGBoost作为分类器,并进行超参数优化;S6、得到训练好的分类器模型;S7、将待测数据集输入训练好的分类器模型得到分类结果,完成对囊泡转运蛋白的识别。本发明用于蛋白识别领域。
-
公开(公告)号:CN113971985A
公开(公告)日:2022-01-25
申请号:CN202111517151.0
申请日:2021-12-13
Applicant: 电子科技大学长三角研究院(衢州)
Abstract: 基于集成学习的嗜热蛋白的识别方法、存储介质及设备,属于蛋白质识别技术和计算机技术交叉领域。为了解决目前的嗜热蛋白的识别方法的识别精度还有待于提高的问题。本发明首先获取待处理的嗜热蛋白数据,并提取嗜热蛋白数据集的数据特征,利用嗜热蛋白的分类模型进行识别;在嗜热蛋白的分类模型的构建过程中,采用M种特征提取方法提取嗜热蛋白数据集的数据特征,采用MRMD算法分别对每个特征文件中的特征进行特征选择,得到特征与实例类别具有相关性的特征子集;引入个机器学习算法与选择后的特征子集进行结合以生成基分类器;然后对基分类器进行筛选并进行集成,通过投票法生成最终的分类结果,进而确定分类模型。主要用于嗜热蛋白的识别。
-
-
-
-
-
-
-
-
-