-
公开(公告)号:CN116775588A
公开(公告)日:2023-09-19
申请号:CN202310793835.6
申请日:2023-06-30
Applicant: 厦门大学 , 杭州海康威视数字技术股份有限公司
IPC: G06F16/174 , G06F16/14
Abstract: 本发明公开了一种基于子文件的数据重删方法、装置及可读介质,获取输入文件,判断输入文件为Office文件或Pdf文件;响应于确定输入文件为Office文件,循环解析Office文件中的局部文件数据,对局部文件数据计算指纹信息,并存入recipe,直至检测到中央目录记录;响应于确定输入文件为Pdf文件,对Pdf文件解析得到stream数据,对stream数据计算指纹信息,并存入recipe;将Office文件中的局部文件数据以及Pdf文件中的stream数据定义为数据块,查询数据块对应的指纹信息是否存在于持久化存储介质的元数据保存结构体数组中,得到查询结果,根据查询结果进行重删,可有效提高重删效率。
-
公开(公告)号:CN112181710B
公开(公告)日:2022-03-29
申请号:CN202010953993.X
申请日:2020-09-11
Applicant: 厦门大学
Abstract: 本发明公开了一种基于比特翻转的固态盘数据存储方法和装置,其中方法包括:初始化步骤:接收写入请求,在内存中初始化用于储存数值的变量;数据比特计数与翻转步骤:对传入的每个基本单位内的比特状态进行统计分析,确定是否进行比特翻转操作,设置相应的翻转标记位,并进行相应的操作,得到处理后的数据;数据封装步骤:将处理后的数据按照原有的数据顺序,进行封装,并将相应的翻转标记位按顺序封装成页面标记位;数据写入步骤:将经过封装后的数据和页面标记位,分别写入存储介质的数据区域和备用区域。本发明提出的方法针对固态盘内存储单元的不同状态泄露电子的概率不同,通过比特翻转的操作降低固态盘内易失电子的状态数量,以提高固态盘的读写性能、使用寿命和可靠性。
-
公开(公告)号:CN112181710A
公开(公告)日:2021-01-05
申请号:CN202010953993.X
申请日:2020-09-11
Applicant: 厦门大学
Abstract: 本发明公开了一种基于比特翻转的固态盘数据存储方法和装置,其中方法包括:初始化步骤:接收写入请求,在内存中初始化用于储存数值的变量;数据比特计数与翻转步骤:对传入的每个基本单位内的比特状态进行统计分析,确定是否进行比特翻转操作,设置相应的翻转标记位,并进行相应的操作,得到处理后的数据;数据封装步骤:将处理后的数据按照原有的数据顺序,进行封装,并将相应的翻转标记位按顺序封装成页面标记位;数据写入步骤:将经过封装后的数据和页面标记位,分别写入存储介质的数据区域和备用区域。本发明提出的方法针对固态盘内存储单元的不同状态泄露电子的概率不同,通过比特翻转的操作降低固态盘内易失电子的状态数量,以提高固态盘的读写性能、使用寿命和可靠性。
-
公开(公告)号:CN107391774A
公开(公告)日:2017-11-24
申请号:CN201710834662.2
申请日:2017-09-15
Applicant: 厦门大学
Abstract: 基于重复数据删除的日志文件系统的垃圾回收方法,涉及计算机数据存储方法。由初始化、并行的数据处理、垃圾回收和结束步骤。根据重复数据删除技术得到的数据块的引用值,将数据分为强数据和弱数据,然后在日志文件系统进行垃圾回收时将强数据块和弱数据块分别迁移到不同的数据段中,从而实现强弱数据的分开存储。对于强数据段,段内数据块的失效率低,进行垃圾回收的次数就少,对于弱数据段,段内数据块的失效率高,进行垃圾回收时需要迁移的有效数据块就少。因此,这种基于重复数据删除的日志文件系统的垃圾回收方法可以有效地减少日志文件系统中垃圾回收时迁移数据块的次数,进而可以提高闪存存储系统的性能和可靠性。
-
公开(公告)号:CN103530237B
公开(公告)日:2016-02-17
申请号:CN201310528584.5
申请日:2013-10-31
Applicant: 厦门大学
Abstract: 一种固态盘阵列的垃圾回收方法,涉及计算机数据存储方法。在固态盘阵列上设置重定向数据映射表和四个功能模块:主控、垃圾回收控制、请求重定向和数据回收,包括初始化步骤、垃圾回收阶段、数据回收阶段和结束步骤等。当某一个正在处理垃圾回收操作的固态盘接收到用户读写请求时,本发明将读请求重定向到固态盘阵列中其他成员固态盘上并通过重构读机制获取读数据;将写请求重定向到热备盘也就是将数据写入到热备盘中,同时更新相应的校验信息;垃圾回收操作完成后,将被重定向到热备盘的写数据回收到固态盘阵列上正确的位置。减轻垃圾回收操作对固态盘阵列系统性能波动的影响,提高固态盘阵列的性能。
-
公开(公告)号:CN103530237A
公开(公告)日:2014-01-22
申请号:CN201310528584.5
申请日:2013-10-31
Applicant: 厦门大学
Abstract: 一种固态盘阵列的垃圾回收方法,涉及计算机数据存储方法。在固态盘阵列上设置重定向数据映射表和四个功能模块:主控、垃圾回收控制、请求重定向和数据回收,包括初始化步骤、垃圾回收阶段、数据回收阶段和结束步骤等。当某一个正在处理垃圾回收操作的固态盘接收到用户读写请求时,本发明将读请求重定向到固态盘阵列中其他成员固态盘上并通过重构读机制获取读数据;将写请求重定向到热备盘也就是将数据写入到热备盘中,同时更新相应的校验信息;垃圾回收操作完成后,将被重定向到热备盘的写数据回收到固态盘阵列上正确的位置。减轻垃圾回收操作对固态盘阵列系统性能波动的影响,提高固态盘阵列的性能。
-
公开(公告)号:CN119576881A
公开(公告)日:2025-03-07
申请号:CN202411790090.9
申请日:2024-12-06
Applicant: 厦门大学
IPC: G06F16/174 , G06F16/172
Abstract: 本发明公开了一种天文数据处理方法,包括以下步骤:对fits文件处理,以使fits文件由行式存储改为列式存储;提取并单独保存元数据,并使除元数据外的主要数据信息不间断的存储;对主要数据信息中的数值矩阵进行降噪处理,并单独保存噪声数据;通过多种预测方式对数值矩阵中除噪声之外的其他元素进行预测处理,并记录压缩率最小的预测方式及记录与其所对应的数值。利用天文数据中的局部性和存在噪声这些特点,对多维数值矩阵应用一种数值预测策略,通过这一预处理提高无损压缩率。首先对fits格式文件的数据排列方式进行重新组织,再对其中占比最大的数值数据进行噪声分离和数值预测,使有效数据更加集中,从而更适合被压缩。
-
公开(公告)号:CN118612437A
公开(公告)日:2024-09-06
申请号:CN202410685525.7
申请日:2024-05-30
Applicant: 厦门大学 , 杭州海康威视数字技术股份有限公司
IPC: H04N19/122 , H04N19/126 , H04N19/132 , H04N19/14 , H04N19/70
Abstract: 本发明公开了一种JPG图片有损压缩方法和装置,包括:获取待压缩的JPG图片并读取待压缩的JPG图片的RGB数据;将待压缩的JPG图片输入目标检测模型,得到目标检测结果,根据目标检测结果对待压缩的JPG图片中的每个像素赋予对应的权重,得到权重矩阵;对RGB数据进行处理,得到DCT变换后的数据;采用权重矩阵对DCT变换后的数据进行加权量化,得到量化后的数据;将量化后的数据进行标准编码,得到压缩后的JPG图片。本发明能够结合待压缩的JPG图片的内容,在不改变JPG图片存储格式,保持JPG图片中关键的目标区域清晰的基础上,尽可能压缩图片的大小。
-
公开(公告)号:CN115826850A
公开(公告)日:2023-03-21
申请号:CN202211265789.4
申请日:2022-10-17
Applicant: 厦门大学
Abstract: 本发明提供一种基于数据引用率的闪存/SCM混合阵列方法,涉及计算机存储领域。构建以Flash闪存存储数据和新型存储介质SCM存储校验信息的RAID4架构,包括:(1)初始化:主控模块首先初始化闪存和SCM,然后初始化元数据;(2)读写请求处理:经由第一步初始化后,接收到读写请求后,进入读写请求处理模块,该模块处理用户发起的读写请求;(3)数据恢复:经由第一步初始化后,接收到数据恢复请求后,进入数据恢复模块,该模块完成数据的恢复工作;(4)基于条带的垃圾回收;利用SCM比Flash介质具有更好的耐久性和读写性能的特征,提高存储系统的整体性能。使用基于条带的垃圾回收策略,将引用次数高的数据块存储在同一条带,减少写放大。
-
公开(公告)号:CN114968103A
公开(公告)日:2022-08-30
申请号:CN202210587980.4
申请日:2022-05-27
Applicant: 厦门大学
IPC: G06F3/06
Abstract: 本发明提出一种基于持久性内存的指纹存储方法,结合持久性内存PM的特性,将指纹索引等元数据从底层设备中剥离,并放置在持久性内存PM中。同时,本发明为PM中未被缓存的指纹元数据构建布隆过滤器且保存在DRAM中。当用户发出写请求时,系统如果在DRAM缓存中查找不到对应的指纹元数据,则可以通过布隆过滤器来确定对应的指纹元数据是否保存在持久性内存PM中,从而避免了传统方式中通过I/O方式在底层设备中查找的过程,极大减小了重复数据删除系统的数据处理过程中对指纹索引等元数据的查找开销。
-
-
-
-
-
-
-
-
-