多类生物序列注释的整合方法

    公开(公告)号:CN110223732B

    公开(公告)日:2021-04-06

    申请号:CN201910411387.2

    申请日:2019-05-17

    Applicant: 清华大学

    Inventor: 江瑞 宋绍铭

    Abstract: 本发明公开了一种多类生物序列注释的整合方法,包括:从生物测序数据中选取一种生物测序数据作为主要生物序列集,其余的作为辅助生物序列集;建立序列‑基因关联映射集;据基因转录起始点获取该基因的基础关联区域和扩展关联区域;对于主要生物序列集的序列,遍历基因的扩展关联区域,若序列所在的区域和某个基因的扩展关联区域有交集,则建立基因和序列的序列‑基因关联映射;对参考数据应用于序列‑基因关联映射集中的生物序列注释的结果采用超几何检验、二项检验计算显著性;对两种方法得到的注释分别排序,并对相同的注释的排序的序号相加后再次排序作为多种生物序列数据的注释结果。本发明实现综合各种特征的注释,在医疗领域具有应用价值。

    基因组单位点变异致病性的预测方法、系统及存储介质

    公开(公告)号:CN110245685A

    公开(公告)日:2019-09-17

    申请号:CN201910401771.4

    申请日:2019-05-15

    Applicant: 清华大学

    Inventor: 江瑞 宋绍铭

    Abstract: 本发明涉及生物信息学技术领域,提供一种基因组单位点变异致病性的预测方法、系统及存储介质。其中,方法包括:根据基因组单位点变异位置和变异情况,获取基因组单位点变异数据和辅助进化保守性数据;对基因组单位点变异数据和辅助进化保守性数据进行预处理,生成矩阵;加载模型,输入矩阵,并分别通过密集连接卷积神经网络进行特征提取,采用多层感知机拼合特征数据并进行计算,输出预测结果。采用本发明能够解决现有技术中基因组单位点变异致病性的预测准确率不高、可信度低、成本昂贵的问题。

    多类生物序列注释的整合方法

    公开(公告)号:CN110223732A

    公开(公告)日:2019-09-10

    申请号:CN201910411387.2

    申请日:2019-05-17

    Applicant: 清华大学

    Inventor: 江瑞 宋绍铭

    Abstract: 本发明公开了一种多类生物序列注释的整合方法,包括:从生物测序数据中选取一种生物测序数据作为主要生物序列集,其余的作为辅助生物序列集;建立序列-基因关联映射集;据基因转录起始点获取该基因的基础关联区域和扩展关联区域;对于主要生物序列集的序列,遍历基因的扩展关联区域,若序列所在的区域和某个基因的扩展关联区域有交集,则建立基因和序列的序列-基因关联映射;对参考数据应用于序列-基因关联映射集中的生物序列注释的结果采用超几何检验、二项检验计算显著性;对两种方法得到的注释分别排序,并对相同的注释的排序的序号相加后再次排序作为多种生物序列数据的注释结果。本发明实现综合各种特征的注释,在医疗领域具有应用价值。

    基因组单位点变异致病性的预测方法、系统及存储介质

    公开(公告)号:CN110245685B

    公开(公告)日:2022-03-25

    申请号:CN201910401771.4

    申请日:2019-05-15

    Applicant: 清华大学

    Inventor: 江瑞 宋绍铭

    Abstract: 本发明涉及生物信息学技术领域,提供一种基因组单位点变异致病性的预测方法、系统及存储介质。其中,方法包括:根据基因组单位点变异位置和变异情况,获取基因组单位点变异数据和辅助进化保守性数据;对基因组单位点变异数据和辅助进化保守性数据进行预处理,生成矩阵;加载模型,输入矩阵,并分别通过密集连接卷积神经网络进行特征提取,采用多层感知机拼合特征数据并进行计算,输出预测结果。采用本发明能够解决现有技术中基因组单位点变异致病性的预测准确率不高、可信度低、成本昂贵的问题。

Patent Agency Ranking