病原微生物宏基因组生信分析参考品及其制备方法和应用

    公开(公告)号:CN114496085B

    公开(公告)日:2022-07-05

    申请号:CN202210392556.4

    申请日:2022-04-15

    Abstract: 本发明涉及一种病原微生物宏基因组生信分析参考品及其制备方法和应用,属于基因检测技术领域。该方法包括以下步骤:建立丰度分布模型:收集临床样本的宏基因组检测数据,建立自变量为测序序列数目因变量为相对丰度的高斯回归模型;标准化高通量测序数据生成:获取参考基因组序列,模拟生成每种微生物物种预定读长和预定测序错误率的高通量序列数据;Gamma‑泊松分布模型:以Gamma‑泊松分布模型拟合临床样本的宏基因组检测数据;参考品制备:以Gamma‑泊松分布模型随机产生一组模拟样本序列数据,并从标准化高通量测序数据中随机挑选相同数目的测序数据,即得。采用该方法得到的生信分析参考品,可全面地评估生物信息分析流程的灵敏度、特异度、召回率和准确性。

    病原微生物宏基因组生信分析参考品及其制备方法和应用

    公开(公告)号:CN114496085A

    公开(公告)日:2022-05-13

    申请号:CN202210392556.4

    申请日:2022-04-15

    Abstract: 本发明涉及一种病原微生物宏基因组生信分析参考品及其制备方法和应用,属于基因检测技术领域。该方法包括以下步骤:建立丰度分布模型:收集临床样本的宏基因组检测数据,建立自变量为测序序列数目因变量为相对丰度的高斯回归模型;标准化高通量测序数据生成:获取参考基因组序列,模拟生成每种微生物物种预定读长和预定测序错误率的高通量序列数据;Gamma‑泊松分布模型:以Gamma‑泊松分布模型拟合临床样本的宏基因组检测数据;参考品制备:以Gamma‑泊松分布模型随机产生一组模拟样本序列数据,并从标准化高通量测序数据中随机挑选相同数目的测序数据,即得。采用该方法得到的生信分析参考品,可全面地评估生物信息分析流程的灵敏度、特异度、召回率和准确性。

    一种构建病原微生物数据鉴定平台的方法及装置

    公开(公告)号:CN115064218B

    公开(公告)日:2022-11-25

    申请号:CN202210986706.4

    申请日:2022-08-17

    Abstract: 本申请公开了一种构建病原微生物数据鉴定平台的方法及装置,所述方法包括:将病原微生物数据进行去重复、去缺失、删除无关信息、数值替换和数据类型转化处理;利用处理后的病原微生物数据构建数据集,所述数据集包括所述处理后的病原微生物数据和与所述处理后的病原微生物数据对应的数据鉴定标签;基于所述数据集,使用PreAI算法构建模型;根据所述模型构建平台。本申请通过对病原微生物数据中的重复、缺失、无关信息等内容进行去除,并且对部分数据进行了数值替换和数据类型转化,有效提高了后续对于模型训练的效率以及准确性,从而能够有效减少鉴定病原微生物数据所需要耗费的时间成本和人工成本。

Patent Agency Ranking