一种基于高通量测序读数的重复DNA序列识别方法

    公开(公告)号:CN110066862A

    公开(公告)日:2019-07-30

    申请号:CN201910428254.6

    申请日:2019-05-22

    Applicant: 中南大学

    Abstract: 本发明公开了一种基于高通量测序读数的重复DNA序列识别方法,包括:由高通量测序的读数得到高频k-mer集合,根据高频k-mer集合对读数进行筛选,使得包含高频k-mer较多的读数保留下来,成为高频读数;使用序列组装工具组装高频读数,得到contigs序列;对contigs序列进行筛选,保留下的所有contigs序列即为重复DNA序列。本发明可以从高通量测序读数中识别重复DNA序列,而无需物种参考序列,可以适用于参考序列未知的物种的重复DNA序列识别,并且本发明是通过组装高频读数得到重复DNA序列,相对于组装高频k-mer得到重复DNA序列,提高了识别重复DNA序列的准确率。

    疾病相关可变剪接异构体预测模型建立及其预测方法

    公开(公告)号:CN116825178A

    公开(公告)日:2023-09-29

    申请号:CN202310784979.5

    申请日:2023-06-29

    Applicant: 中南大学

    Inventor: 李洪东 刘佳淑

    Abstract: 本公开实施例中提供了一种疾病相关可变剪接异构体预测模型建立及其预测方法,属于生物信息技术领域,具体包括:收集真实RNA‑seq数据以及标签;计算表达数据;对表达数据分别进行预处理;构建基因共表达网络和可变剪接异构体共表达网络,并据此构建共享图卷积神经网络模型;步骤5,构建对抗域适应模型并结合共享图卷积神经网络模型形成初始预测模型,训练初始预测模型,得到目标预测模型;利用测试集计算目标预测模型的评价参数并判断其是否符合预设要求,若是,则执行步骤7,若否,则返回步骤5;步骤7,将待检测可变剪接异构体输入目标预测模型,得到预测致病结果。通过本公开的方案,提高了预测可靠性和精准度。

    一种蛋白质异构体对相互作用预测方法及装置

    公开(公告)号:CN111370068B

    公开(公告)日:2022-11-04

    申请号:CN202010157694.5

    申请日:2020-03-09

    Applicant: 中南大学

    Abstract: 本发明公开了一种蛋白质异构体对相互作用预测方法及装置,所述方法包括以下步骤,首先对于每个蛋白质异构体对,基于其在n个组织中的表达数据的皮尔逊相关系数分别确定其n个特征;然后获取蛋白质相互作用数据,其中包括具有相互作用的蛋白质对,对于这些蛋白质对,筛选出仅对应一个蛋白质异构体对的蛋白质对,令其对应的蛋白质异构体对的标签为1;利用随机采样方法产生不具有相互作用的蛋白质对,令其对应的所有蛋白质异构体对的标签为0;将确定了标签的蛋白质异构体对作为样本,基于样本数据训练预测模型;最后对于待分类的蛋白质异构体对,将其特征数据输入训练好的预测模型,得到其预测结果。本发明能够较准确的预测蛋白质相互作用关系。

    一种蛋白质异构体对相互作用预测方法及装置

    公开(公告)号:CN111370068A

    公开(公告)日:2020-07-03

    申请号:CN202010157694.5

    申请日:2020-03-09

    Applicant: 中南大学

    Abstract: 本发明公开了一种蛋白质异构体对相互作用预测方法及装置,所述方法包括以下步骤,首先对于每个蛋白质异构体对,基于其在n个组织中的表达数据的皮尔逊相关系数分别确定其n个特征;然后获取蛋白质相互作用数据,其中包括具有相互作用的蛋白质对,对于这些蛋白质对,筛选出仅对应一个蛋白质异构体对的蛋白质对,令其对应的蛋白质异构体对的标签为1;利用随机采样方法产生不具有相互作用的蛋白质对,令其对应的所有蛋白质异构体对的标签为0;将确定了标签的蛋白质异构体对作为样本,基于样本数据训练预测模型;最后对于待分类的蛋白质异构体对,将其特征数据输入训练好的预测模型,得到其预测结果。本发明能够较准确的预测蛋白质相互作用关系。

    一种基于时空图网络的多中心医疗数据预测方法

    公开(公告)号:CN118335268A

    公开(公告)日:2024-07-12

    申请号:CN202410214861.3

    申请日:2024-02-27

    Applicant: 中南大学

    Abstract: 本发明提供了一种基于时空图网络的多中心医疗数据预测方法,包括:将时空图网络模型分裂为初始空间网络模型和初始时序网络模型分别发送至分裂服务器和多个客户端;每个客户端将采集的本地医疗数据输入初始时序网络模型得到激活并上传至分裂服务器构造群体图;将群体图输入初始空间网络模型得到空间特征,并计算损失值得到特征梯度;根据特征梯度对初始空间网络模型的参数和初始时序网络模型进行更新,得到第一局部全局模型和第二局部全局模型并将第二局部全局模型与第一局部全局模型进行合并,得到全局模型,用于对待处理的医疗数据进行预测,得到预测结果,提高了时空图网络模型的整体泛化能力,从而提高了医疗数据的预测效果。

    基于可变剪接百分比特征的致病基因预测方法

    公开(公告)号:CN118155709A

    公开(公告)日:2024-06-07

    申请号:CN202410197673.4

    申请日:2024-02-22

    Applicant: 中南大学

    Abstract: 本公开实施例中提供了一种基于可变剪接百分比特征的致病基因预测方法,属于生物信息技术领域,具体包括:收集人类大脑RNA‑seq样本,并计算相应的PS I值,为每个基因构建一个PS I矩阵;根据PS I矩阵运行Transformer模型,得到每个基因对应的可变剪接特征;收集人类基因功能网络并运行图嵌入算法,得到每个基因的基础特征;将每个基因的可变剪接特征和基础特征进行特征融合,得到每个基因的特征表示;收集疾病关联基因与非疾病关联基因,得到训练集;利用特征表示和训练集,基于离群检测框架训练预测模型并对目标基因进行致病性预测。通过本公开的方案,提高了预测精准度。

    基于相似性的病毒-受体相互作用关系预测方法和装置

    公开(公告)号:CN110838342B

    公开(公告)日:2022-08-16

    申请号:CN201911108401.8

    申请日:2019-11-13

    Applicant: 中南大学

    Abstract: 本发明公开了一种基于相似性的病毒‑受体相互作用关系预测方法和装置,所述方法首先基于已知的病毒‑受体相互作用关系数据分别构建病毒和受体的高斯核相似性矩阵;利用受体的序列信息构建受体的序列相似性矩阵;并基于受体序列相似性矩阵和高斯核相似性矩阵集成最终的受体相似性。然后根据邻接信息对不存在相互作用关系的病毒和受体的相互作用关系进行初始化处理。最后利用拉普拉斯正则化最小二乘法来计算病毒‑受体对的相互作用关系分数。本发明能够对病毒‑受体相互作用关系进行有效的预测。

    内含子保留预测模型建立方法及其预测方法

    公开(公告)号:CN111370055A

    公开(公告)日:2020-07-03

    申请号:CN202010146731.2

    申请日:2020-03-05

    Applicant: 中南大学

    Abstract: 本发明公开了一种内含子保留预测模型建立方法,包括收集内含子保留相关的模拟数据和真实数据;定义基因组中所有独立内含子集合并作为标准模板;获取得到的模拟数据中所设定的内含子序列读数分布模式图片数据集并处理得到处理后的数据集;将处理后的数据集按照设定比例划分为训练集和测试集;采用训练集训练神经网络模型得到最终建立的神经网络内含子保留预测模型。本发明还公开了包括所述内含子保留预测模型建立方法的预测方法。本发明能够基于内含子保留读数分布模式对内含子进行可视化以及预测,而且可靠性高,准确性好。

    一种基于蛋白质信息的基因组序列拼接方法

    公开(公告)号:CN108897986A

    公开(公告)日:2018-11-27

    申请号:CN201810530874.6

    申请日:2018-05-29

    Applicant: 中南大学

    Abstract: 本发明公开了一种基于蛋白质信息的基因组序列拼接方法,包括:获取待拼接的DNA序列与蛋白质序列之间的比对信息;确定每条蛋白质序列上对应的DNA序列之间的相邻关系;构建相邻DNA序列之间的连接边并获取每个蛋白质序列上对应的每个DNA序列连接边的支持信息;依次对每个DNA序列连接边的支持信息进行去噪处理;基于权重打分函数依次对每个DNA序列的前、后节点进行去噪处理;计算存在支持信息的所有DNA序列连接边的连接间距;基于所有DNA序列连接边的连接间距以及每个DNA序列的前、后节点依次串接得到基因组序列拼接路径。通过上述方法提高基因组序列拼接结果的敏感性和精确度。

Patent Agency Ranking