基于惩罚回归和测序物理连锁的病毒共感染检测方法及系统

    公开(公告)号:CN119694385A

    公开(公告)日:2025-03-25

    申请号:CN202411763901.6

    申请日:2024-12-03

    Inventor: 顾宁 曹晨 陈开阳

    Abstract: 本发明公开了一种基于惩罚回归和测序物理连锁的病毒共感染检测方法和系统。方法包括:收集病毒序列及其对应谱系信息;统计筛选高频率变异得到谱系的代表性变异;使用谱系的代表性变异构建病毒谱系位点变异图谱作为重建模型的参考图谱;为参考基因组建立索引,并使用BWA将待重建的病毒测序样本与参考基因组进行比对;将比对后的测序样本转为二进制格式的BAM文件;对比对后的病毒测序样本进行变异检测得到单核苷酸多态性SNP和插入/删除INDEL及其频率信息;最后根据样本的SNP和INDEL及其频率和参考图谱构建回归方程;使用平方误差损失函数结合L0正则化和L1正则化进行回归,最终得到样本对应的谱系单倍型及其频率。

    基于汇总统计数据的复杂性状关联基因检测方法及系统

    公开(公告)号:CN119694384A

    公开(公告)日:2025-03-25

    申请号:CN202411763900.1

    申请日:2024-12-03

    Inventor: 曹晨 王俊杰 田敏

    Abstract: 本发明公开了一种基于汇总统计数据的复杂性状关联基因检测方法及系统。该方法可根据自定义设置解析复杂性状的汇总统计数据和基因表达权重数据,并从中提取有效遗传信息,包括基因范围内的遗传变异位点集合及其对应的基因表达权重和显著性P值。基于这些权重和P值,应用联合柯西关联检验,识别出与复杂性状显著关联的基因。本发明创新性地提出了一种适用于汇总统计数据的性状关联基因检测方法,显著扩展了数据的分析范围进而提高关联的统计效能。同时,基于解析算法有效提升了关联测试的计算效率,降低了计算负担,实现了复杂性状关联基因的快速、准确识别。

Patent Agency Ranking