一种基于群体基因组的序列比对方法

    公开(公告)号:CN115602246B

    公开(公告)日:2023-06-20

    申请号:CN202211366121.9

    申请日:2022-10-31

    Abstract: 一种基于群体基因组的序列比对方法,具体涉及一种基于群体基因组的人体DNA序列比对方法,为了解决以单一参考基因组作为基准的序列比对方法存在精度偏差,导致测序数据变异检测失败或得到错误变异位点的问题,首先构建基于种子序列的群体基因组索引,提取测序序列的种子序列,利用索引获取种子序列在基因组的位置;其次,根据位置利用稀疏动态规划方法得到种子序列在基因组上最优和次优路径集合;最终,根据最优和次优路径集合得到测序序列在基因组上对应的序列,采用KSW2算法比对测序序列与对应的序列,得到比对得分,根据比对得分得到结果比对文件。属于序列比对领域。

    基于泛基因组的序列实时比对方法

    公开(公告)号:CN115662521B

    公开(公告)日:2023-06-13

    申请号:CN202211386630.8

    申请日:2022-11-07

    Abstract: 基于泛基因组的序列实时比对方法,具体涉及一种面向边合成边测序类测序技术的基于泛基因组的序列实时精确比对方法,为解决由于DNA序列比对是在序列测序之后,导致边合成边测序类测序技术在序列比对时会耗费大量的计算资源以及计算时间的问题,构建泛基因组;将泛基因组转换为线性序列与线性参考基因组合并;将合并序列的正反序列合并,并构建其BWT索引;删除BWT索引的SA列表上无效或者重复的信息;根据新BWT索引对待测序序列进行比对,得到比对结果并存储;获取待测序序列在泛基因组上的比对位置;选取待测序序列最优的比对位置作为最终比对结果;利用基数排序算法对最终比对结果进行排序,完成待测序序列的比对。

    基于深度神经网络的乳腺癌预后指示系统、存储介质及设备

    公开(公告)号:CN115631849A

    公开(公告)日:2023-01-20

    申请号:CN202211291501.0

    申请日:2022-10-19

    Abstract: 基于深度神经网络的乳腺癌预后指示系统、存储介质及设备,属于癌症预后指示技术领域。本发明为了解决现有的乳腺癌预后预测准确率有待于提高的问题。本发明根据用户输入实例对应的组学特征在TCGA数据库中获取相同的全部乳腺癌实例的组学特征,然后针对每个组学数据分别计算特征的肯德尔相关系数矩阵,根据相关系数矩阵确定全局基因相似系数矩阵及最相近基因相似系数矩阵,并通过迭代计算多组学特征相似性融合矩阵进而获得多组学特征的全局相似性,之后根据非负矩阵分解的方式对其进行分解,根据分解结果对用户取户输入的组学特征进行加权,然后利用机器学习模型进行乳腺癌预后预测。本发明用于乳腺癌的预后指示。

    一种基于序列比对骨架的基因组变异检测方法

    公开(公告)号:CN115602244A

    公开(公告)日:2023-01-13

    申请号:CN202211304319.4

    申请日:2022-10-24

    Abstract: 一种基于序列比对骨架的基因组变异检测方法,涉及基因检测技术领域,针对现有技术中变异检测效率低的问题,本申请提出的基于比对骨架和共识序列重构的变异检测方法,通过稀疏动态规划构建测序片段比对骨架,采用Landau‑Vishkin和Smith‑Waterman算法对骨架GAP区域进行填充;据不同候选变异位点的序列和分布特征将其划分为高置信度候选变异位点和低置信度候选变异位点,并分别使用两种不同的策略进行变异检测和基因型推断。1)序列比对阶段,本申请较当前主流比对方法比对效率提升7倍以上;2)变异检测阶段,本申请较当前主流变异检测方法检测效率提升20‑70倍。

    基于2D嵌入的半监督单细胞聚类方法、装置、计算机设备

    公开(公告)号:CN113611368A

    公开(公告)日:2021-11-05

    申请号:CN202110844660.8

    申请日:2021-07-26

    Abstract: 本发明公开了一种基于2D嵌入的半监督单细胞聚类方法、装置、计算机设备。其中,所述方法包括:对每个细胞进行数据预处理,和将该经对数据预处理后的每个细胞的基因表达数据都使用2D嵌入的方式,生成一张张合成图像形成图像集,和将该图像集输入到自编码器模型中进行预训练和聚类,和基于该将该图像集输入到自编码器模型中进行预训练和聚类后的聚类结果,构建网络,并运用社区发现算法对该构建网络中的图像集数据进行分类,以及采用将基于卷积神经网络模型来配置的半监督神经网络,对该经分类后的图像集中的所有细胞图像数据进行特征提取,并对该提取的特征进行聚类。通过上述方式,能够实现提高在单细胞数据上进行聚类时的聚类效果。

    基于图神经网络的基因模块挖掘方法、装置、计算机设备

    公开(公告)号:CN113611366A

    公开(公告)日:2021-11-05

    申请号:CN202110854545.9

    申请日:2021-07-26

    Abstract: 本发明公开了一种基于图神经网络的基因模块挖掘方法、装置、计算机设备。其中,所述方法包括:根据基因表达谱数据,构造基因共表达网络,和基于该构造的基因共表达网络,通过图神经网络方式,配置社区隶属度矩阵,以及基于该配置的社区隶属度矩阵,通过设定阈值的方式,生成已知模块。通过上述方式,能够实现通过图神经网络表示学习的方式配置社区归属矩阵,再通过设定阈值的方式生成已知模块,实现在基因模块挖掘结果上能够允许有密集连接的多个基因可归属于不同的模块。

    LncRNA预测方法、装置、计算设备及计算机可读存储介质

    公开(公告)号:CN112201308A

    公开(公告)日:2021-01-08

    申请号:CN202011085761.3

    申请日:2020-10-12

    Abstract: 本发明涉及一种LncRNA预测方法、装置、计算设备及计算机可读存储介质。所述LncRNA预测方法包括:获取包含LncRNA的原始数据;对所述包含LncRNA的原始数据进行数据处理,抽取出用于LncRNA预测的特征,所述特征至少包括提取自拓扑熵和广义拓扑熵的特征;将所述包含LncRNA的原始数据作为输入提供机器学习预测模型,所述机器学习预测模型基于所述用于LncRNA预测的特征对包含LncRNA的原始数据进行分类;获取所述机器学习预测模型的输出,得到LncRNA预测结果。本发明实现了有效的LncRNA预测,且加快了训练过程,而且对于DNA序列中其他功能元素的研究也具有可扩展性。

    一种应用于基因表达谱数据的降维方法

    公开(公告)号:CN110827919A

    公开(公告)日:2020-02-21

    申请号:CN201911071223.6

    申请日:2019-11-05

    Abstract: 本发明提出了一种应用于基因表达谱数据的降维方法,属于计算机应用领域。步骤一:利用回归系数对样本数据矩阵进行“剪枝”,对“剪枝”后的矩阵进行主成分分析,得到主成分Uθ;步骤二:利用回归系数对样本数据矩阵进行“缩放”,对“缩放”后的矩阵进行主成分分析,得到主成分U';步骤三:使用权值α对主成分Uθ和U'进行融合,得到新的主成分X'θ;步骤四:使用主成分X'θ建立分类回归模型,验证降维的效果。本发明解决了现有降维算法在不同特征数量下分类性能不稳定,建立在其上的分类器预测性能比较低的问题,分类效果不理想的问题。

Patent Agency Ranking