基于分离式内存的写优化哈希索引构建方法及系统

    公开(公告)号:CN119248667A

    公开(公告)日:2025-01-03

    申请号:CN202411275767.5

    申请日:2024-09-12

    Applicant: 厦门大学

    Abstract: 本发明公开了一种基于分离式内存的写优化哈希索引构建方法及系统,包括:基于分离式内存设计,在内存节点中建立包括目录、段和桶的哈希索引结构,以及建立包括叶子项与非叶子项的目录树结构,并在计算节点缓存相应目录;为桶中每个槽维护相应的预测器,在分裂时通过读取预测器中的相应位指示分裂时槽应放置的位置;在哈希索引引入分裂时,在内存节点中开启一个单线程的内存爬虫定期搜索未更新的预测器;通过被动确认与批处理将多个RDMA操作合并至一个RDAM请求中,将多个往返时间压缩至一个。本发明将多层级的目录与可扩展哈希结合,以细粒度的方式对哈希索引进行扩展与同步,同时通过预测器部件与优化分裂降低了分裂开销,最终提升写性能。

    基于混合存储的高性能可扩展哈希索引

    公开(公告)号:CN117112557A

    公开(公告)日:2023-11-24

    申请号:CN202311023921.5

    申请日:2023-08-15

    Applicant: 厦门大学

    Abstract: 基于混合存储的高性能可扩展哈希索引,涉及键值存储与哈希索引。该索引在持久化CPU高速缓存的最下层缓存上建立可调整大小的收集日志池以日志为单位刷写至持久性内存,以弥合键值对大小与持久性内存的写入粒度的差距;在易失内存中建立一个较小的索引,用于分类被刷写收集日志的键值对;采用无搜索插入与自底向上搜索,在保证正确性的前提下将插入前的搜索移除,以减少插入操作的读写混合;无检查的插入带来多次重复键值的插入,在分裂中添加低开销一致性检查,消除重复键对索引空间的占用;搜索大容量的哈希桶增加平均探测次数,在易失内存中存放索引键的特征值采用SIMD技术,在易失内存中吸收无用桶探测,提高索引搜索效率。

Patent Agency Ranking