一种基因型数据压缩及检索方法、装置、设备及计算机可读存储介质

    公开(公告)号:CN118692573A

    公开(公告)日:2024-09-24

    申请号:CN202410695989.6

    申请日:2024-05-31

    Abstract: 本申请提供了一种基因型数据压缩及检索方法、装置、设备及计算机可读存储介质,所述方法包括:对原始基因型数据进行压缩;对压缩后的基因型数据进行编码;将编码后的基因型数据存储到非关系型数据库;从所述非关系型数据库中快速检索到符合预设条件的基因型数据。本申请实施例提供的方案中,通过使用高效的压缩、编码、聚类、排序等方法,有效压缩大样本基因型信息,从而减少多样本基因型数据的存储空间,使基因型信息利于存储、检索等后续处理。并通过数据库联合索引,加速基于染色体位置区间的检索速度,提高数据库查询效率。最后通过快速解码算法获取所有样本的基因型信息,大大减少了基因数据存储成本,提高了数据检索分析效率。

Patent Agency Ranking