-
公开(公告)号:CN117851537A
公开(公告)日:2024-04-09
申请号:CN202410070820.1
申请日:2024-01-18
Applicant: 南开大学
Abstract: 本发明提供一种时序数据存储引擎的索引构建方法,属于数据库存储技术领域。具体包括:根据标签键的文档频率及标签值的出现频率对数据块进行预筛选;通过标签键的历史访问频率,对预筛选集合进行特征提取,获得数据特征并进行机器学习以进一步筛选,获得包括每条时间线的指标标签组的目标集合;根据指标标签组中多个不同的指标对目标集合进行目标标签提取,获得多个组标签集合;对指标标签相同的组标签集合置入对应的时间线,获得多个时间线集合;对每个时间线集合分配唯一的组ID,建立标签键值对与组ID映射的倒排索引,并建立目标标签与倒排索引映射的前置索引。本发明能够提升时序数据的写入效率与索引构建效率。