一种基于学习索引的数据重删方法和系统

    公开(公告)号:CN118567562A

    公开(公告)日:2024-08-30

    申请号:CN202410699704.6

    申请日:2024-05-31

    Abstract: 本发明公开了一种基于学习索引的数据重删方法和系统,包括:若数据块请求为写请求,则将数据块写入内存缓存并计算指纹值,将指纹值和逻辑页地址写入LPA‑FP索引表;若内存缓存中的所有数据块的数量达到阈值,则为内存缓存中的所有数据块分配对应的物理页地址,并生成若干个FP‑PPA映射,根据若干个FP‑PPA映射通过分段线性回归计算得到FP‑PPA表达式,将FP‑PPA表达式写入内存缓存和闪存,并将内存缓存中的所有数据块写入闪存,将数据块及其相邻数据块的指纹值保存在带外数据区域;若数据块请求为读请求,则根据逻辑页地址在LPA‑FP索引表中查找指纹值,根据指纹值和FP‑PPA表达式计算出物理页地址并在闪存中查询所要读取的数据块,以减少内存缓存的空间并加快物理页地址的查找速度。

    一种基于持久性内存的指纹存储方法

    公开(公告)号:CN114968103B

    公开(公告)日:2024-06-18

    申请号:CN202210587980.4

    申请日:2022-05-27

    Applicant: 厦门大学

    Abstract: 本发明提出一种基于持久性内存的指纹存储方法,结合持久性内存PM的特性,将指纹索引等元数据从底层设备中剥离,并放置在持久性内存PM中。同时,本发明为PM中未被缓存的指纹元数据构建布隆过滤器且保存在DRAM中。当用户发出写请求时,系统如果在DRAM缓存中查找不到对应的指纹元数据,则可以通过布隆过滤器来确定对应的指纹元数据是否保存在持久性内存PM中,从而避免了传统方式中通过I/O方式在底层设备中查找的过程,极大减小了重复数据删除系统的数据处理过程中对指纹索引等元数据的查找开销。

    一种基于内存重复数据删除的页面聚合重组方法和系统

    公开(公告)号:CN117992361A

    公开(公告)日:2024-05-07

    申请号:CN202410234367.3

    申请日:2024-03-01

    Applicant: 厦门大学

    Abstract: 本发明一种基于内存重复数据删除的页面聚合重组方法和系统,包括:初始化内存重复数据删除的扫描结构及操作所需的数据结构;动态扫描各个进程的虚拟地址空间,释放重复页面并缓存相关项;将重删后留下的只读页表项和共享页面进行聚集;原地将被拆分的大页面重新组合为新大页,并重构新的大页表项。本发明通过对特殊共享项的聚合方法,在不减少共享页面的情况下,通过迁移共享页面和其对应的只读页表项,清理出合适的内存页面进行大页面的重新组合,充分保留由共享页面带来的内存节省,在最大化内存节省的同时提高系统中大页面的数量,达到降低内存占用和提高访存性能的效果。

    一种非易失性存储介质的数据处理方法和计算机存储介质

    公开(公告)号:CN112181288B

    公开(公告)日:2022-03-04

    申请号:CN202010825520.1

    申请日:2020-08-17

    Applicant: 厦门大学

    Abstract: 一种非易失性存储介质的数据处理方法和计算机存储介质,初始化步骤完成后,根据用户的指令进行并发的数据插入、数据查询、数据删除和数据更新步骤,并发的顺利执行由自旋锁来保证。数据插入和数据删除步骤中如果需要改变哈希表大小,则触发调整哈希表大小步骤,当哈希表大小调整完后,继续执行数据插入和数据删除步骤。当用户发出结束访问指令时,进入结束步骤。本发明减少对哈希表的级联写入并有效地解决哈希冲突,同时减少调整哈希表大小操作时需要移动的数据,减少频繁写入时调整哈希表大小操作执行的次数,进而提高非易失性存储介质的寿命,保证数据一致性的同时提高哈希索引结构在非易失性存储介质上的性能。

    一种非易失性存储介质的数据处理方法和计算机存储介质

    公开(公告)号:CN112181288A

    公开(公告)日:2021-01-05

    申请号:CN202010825520.1

    申请日:2020-08-17

    Applicant: 厦门大学

    Abstract: 一种非易失性存储介质的数据处理方法和计算机存储介质,初始化步骤完成后,根据用户的指令进行并发的数据插入、数据查询、数据删除和数据更新步骤,并发的顺利执行由自旋锁来保证。数据插入和数据删除步骤中如果需要改变哈希表大小,则触发调整哈希表大小步骤,当哈希表大小调整完后,继续执行数据插入和数据删除步骤。当用户发出结束访问指令时,进入结束步骤。本发明减少对哈希表的级联写入并有效地解决哈希冲突,同时减少调整哈希表大小操作时需要移动的数据,减少频繁写入时调整哈希表大小操作执行的次数,进而提高非易失性存储介质的寿命,保证数据一致性的同时提高哈希索引结构在非易失性存储介质上的性能。

    基于重复数据删除的闪存性能和可靠性提升方法及系统

    公开(公告)号:CN118092799A

    公开(公告)日:2024-05-28

    申请号:CN202410224135.X

    申请日:2024-02-29

    Applicant: 厦门大学

    Abstract: 本发明一种基于重复数据删除的闪存性能和可靠性提升方法及系统,在固态盘上设置闪存重复数据删除系统的指纹索引表、重复数据删除功能、读写干扰检测功能、读请求位置重定向功能和数据恢复功能;当服务写入请求的时候,通过检测索引表来判断该请求是否需要删除,如果写请求的引用次数达到阈值需要将该数据进行备份;当服务读请求的时候,通过读写干扰模块检测数据读取的过程中是否被正在执行的写请求干扰,如果确定被写请求干扰则通过读请求位置重定向功能访问备份数据的位置。本发明在减少闪存空间开销的基础上,优化了因闪存读写干扰而带来的闪存性能下降问题,同时优化了因重复数据删除技术而导致的数据可靠性问题。

    基于DPU的纠删编解码卸载方法及DPU存储架构

    公开(公告)号:CN117992279A

    公开(公告)日:2024-05-07

    申请号:CN202311805718.3

    申请日:2023-12-26

    Applicant: 厦门大学

    Abstract: 本发明公开了一种基于DPU的纠删编解码卸载方法及DPU存储架构,将EC编解码功能分成三个部分,分别为存储数据、读取数据和恢复数据;所有数据的EC编解码与数据分布策略计算都由DPU去实现,CPU主要功能为检测本存储节点各个SSD与DPU的健康状况,与各个SSD空余空间状况。本发明一种基于DPU的EC编解码卸载方法与为其方法设定的一种专用高效率全硬件可实现DPU存储架构,通过DPU能够更快地处理相关数据计算,将CPU从EC编解码相关事务中完全释放。

    基于变长指纹的数据重删方法、装置及可读介质

    公开(公告)号:CN116820343A

    公开(公告)日:2023-09-29

    申请号:CN202310801832.2

    申请日:2023-06-30

    Abstract: 本发明公开了一种基于变长指纹的数据重删方法、装置及可读介质,对输入文件进行分块,根据数据块的长度采用不同的哈希算法计算数据块对应的指纹;响应于在LRU缓存中查询不到该指纹,则根据该指纹所对应的哈希算法在不同的持久化存储介质中查询;响应于在持久化存储介质中查询到该指纹,将该指纹和元数据存入LRU缓存中,并利用局部性原理将包含该指纹的输入文件中同属于同一持久化存储介质的指纹全部存入LRU缓存中;响应于在持久化存储介质中查询不到该指纹,则构建该指纹的元数据并存储在对应的持久化存储介质,并将该指纹对应的数据块存储在开放容器中,在持久化存储介质中采用对应格式的指纹存储文件对元数据进行分类存储,加快查找。

    一种基于多段线性回归模型的固态盘地址转换加速方法

    公开(公告)号:CN115481055A

    公开(公告)日:2022-12-16

    申请号:CN202211166847.8

    申请日:2022-09-23

    Applicant: 厦门大学

    Abstract: 本发明提出一种基于多段线性回归模型的固态盘地址转换加速方法,包括初始化步骤、数据写操作步骤、垃圾回收与模型训练步骤以及数据读操作步骤;在固态盘的内存中为闪存中的全局映射表分组建立低开销的多段线性回归模型,并随固态盘的垃圾回收周期性更新。对于无法在需要局部性的热映射表中命中的逻辑页号,可以在模型中尝试命中,极大地减少了固态盘随机读场景下地址转换中的双读问题带来的查找开销,进而提高固态盘的随机读取性能。

Patent Agency Ranking