-
公开(公告)号:CN117194355A
公开(公告)日:2023-12-08
申请号:CN202311479500.3
申请日:2023-11-08
Applicant: 本原数据(北京)信息技术有限公司 , 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06F16/174 , G06F16/14 , G06F3/06
Abstract: 本申请实施例提供了一种基于数据库的数据处理方法、装置和电子设备,属于数据处理技术领域。该方法包括:根据新增数据表的数据类型筛选出选中数据表,从选中数据表中提取预设批量大小。根据预设批量大小和预设值构建预设批量范围,预设批量范围包括多个第一批量大小,根据第一批量大小对新增数据表进行压缩,得到多个候选数据表。获取每一候选数据表的第一扫描时间,将最小的第一扫描时间对应的第一批量大小作为目标批量大小;按目标批量大小对新增数据表进行压缩,得到目标数据表。按目标批量大小对新增数据表进行压缩时,得到的目标数据表扫描时间最小,因此实现了解压速度和压缩率之间的平衡。
-
公开(公告)号:CN113076068B
公开(公告)日:2022-10-21
申请号:CN202110460957.4
申请日:2021-04-27
Applicant: 哈尔滨工业大学(深圳)
Abstract: 本申请公开了一种数据存储方法、装置、电子设备及计算机可读存储介质,该方法包括:获取并拆分目标数据,得到多个目标数据块;判断目标数据块中是否存在已经被存储的重复数据块;若存在重复数据块,则将各个重复数据块分别从源数据容器迁移至若干个第一新增容器中存储,并将目标数据块中的非重复数据块存入第二新增容器;若不存在重复数据块,则将目标数据块存入第三新增容器;建立新增容器与目标数据之间的目标容器对应关系;该方法在进行数据存储时,将各个数据块按照其生命周期进行排列;在进行数据读取时,可以只读出需要的数据块而不附带任何其他数据,避免出现读放大现象,提高了数据读取速度。
-
公开(公告)号:CN112054805A
公开(公告)日:2020-12-08
申请号:CN202010961326.6
申请日:2020-09-14
Applicant: 哈尔滨工业大学(深圳)
IPC: H03M7/30
Abstract: 本发明实施例提供了一种模型数据压缩方法、系统及相关设备,用于节约网络传输资源,提高模型数据压缩率。本发明实施例方法包括:计算目标模型与参考模型中的同种类型参数之间的差量数据;采用预设压缩算法对所述差量数据进行压缩得到目标压缩文件;将所述目标压缩文件发送给目标终端设备,以使得所述目标终端设备根据所述差量数据以及本地存储的所述参考模型恢复所述目标模型。
-
公开(公告)号:CN111125258B
公开(公告)日:2023-03-28
申请号:CN201911370675.4
申请日:2019-12-26
Applicant: 哈尔滨工业大学(深圳)
IPC: G06F16/27
Abstract: 本发明实施例提供了一种数据同步的方法、客户端、服务端及系统,用于基于内容可变长度分块对客户端和服务端中需要同步的第一数据和第二数据进行分块,从而使得对第一数据和第二数据的分块只有在插入数据块的少量数据块处发生变动,而其他数据块则不受影响。本发明实施例方法包括:确定预设长度为M的滑动窗口;利用滑动窗口依次遍历客户端中需要同步的第一数据,并在执行遍历时,计算每个滑动窗口中字符的哈希值F;当被遍历的第一数据满足第一条件时,将所述滑动窗口所处的位置定义为数据分块点,以将所述第一数据划分为多个数据块,其中,所述第一条件为:所述F mod D=r,所述D表示所述数据块的预期长度,所述r为小于D的任意自然数。
-
公开(公告)号:CN115292208A
公开(公告)日:2022-11-04
申请号:CN202210944094.2
申请日:2022-08-05
Applicant: 哈尔滨工业大学(深圳)
IPC: G06F12/02 , G06F16/16 , G06F16/176
Abstract: 本申请实施例公开了一种垃圾回收方法、计算机设备及计算机存储介质。通过建立文件关系图来表示各文件之间对数据块的共享和引用的情况,进而根据文件关系图来确定待删除文件中被其他文件共享和引用的目标数据块,进而保留目标数据块以及将待删除文件的多个数据块中除了目标数据块之外的数据块清除。因此,可快速确定待删除文件中需要保留的数据块以及需要被删除的数据块,提升了垃圾回收和清理的处理效率,加速垃圾数据的清理工作,并且可减少内存资源的消耗。
-
公开(公告)号:CN113076068A
公开(公告)日:2021-07-06
申请号:CN202110460957.4
申请日:2021-04-27
Applicant: 哈尔滨工业大学(深圳)
Abstract: 本申请公开了一种数据存储方法、装置、电子设备及计算机可读存储介质,该方法包括:获取并拆分目标数据,得到多个目标数据块;判断目标数据块中是否存在已经被存储的重复数据块;若存在重复数据块,则将各个重复数据块分别从源数据容器迁移至若干个第一新增容器中存储,并将目标数据块中的非重复数据块存入第二新增容器;若不存在重复数据块,则将目标数据块存入第三新增容器;建立新增容器与目标数据之间的目标容器对应关系;该方法在进行数据存储时,将各个数据块按照其生命周期进行排列;在进行数据读取时,可以只读出需要的数据块而不附带任何其他数据,避免出现读放大现象,提高了数据读取速度。
-
公开(公告)号:CN111125258A
公开(公告)日:2020-05-08
申请号:CN201911370675.4
申请日:2019-12-26
Applicant: 哈尔滨工业大学(深圳)
IPC: G06F16/27
Abstract: 本发明实施例提供了一种数据同步的方法、客户端、服务端及系统,用于基于内容可变长度分块对客户端和服务端中需要同步的第一数据和第二数据进行分块,从而使得对第一数据和第二数据的分块只有在插入数据块的少量数据块处发生变动,而其他数据块则不受影响。本发明实施例方法包括:确定预设长度为M的滑动窗口;利用滑动窗口依次遍历客户端中需要同步的第一数据,并在执行遍历时,计算每个滑动窗口中字符的哈希值F;当被遍历的第一数据满足第一条件时,将所述滑动窗口所处的位置定义为数据分块点,以将所述第一数据划分为多个数据块,其中,所述第一条件为:所述F mod D=r,所述D表示所述数据块的预期长度,所述r为小于D的任意自然数。
-
公开(公告)号:CN109977715A
公开(公告)日:2019-07-05
申请号:CN201910165390.0
申请日:2019-03-05
Applicant: 哈尔滨工业大学(深圳)
IPC: G06K7/14
Abstract: 本发明提供了一种基于轮廓识别的二维码识别方法,通过定位标记的轮廓的拓扑结构来识别定位标记。本发明还提供了一种基于轮廓识别的二维码。本发明的有益效果是:改进过后的定位标记不再使用原先显式的识别特征,而是以“定位标记轮廓的拓扑结构”这种更加隐式的特征来识别定位标记,在扫码时通过对图形的拓扑结构进行分析,找出其中符合要求的拓扑结构识别为定位标记,从而解放定位标记的具体形状,可以根据需求来进行定制,从而让二维码的形式可以更加的个性化,也有利于保持二维码整体的容错能力。
-
公开(公告)号:CN112054805B
公开(公告)日:2023-03-31
申请号:CN202010961326.6
申请日:2020-09-14
Applicant: 哈尔滨工业大学(深圳)
IPC: H03M7/30
Abstract: 本发明实施例提供了一种模型数据压缩方法、系统及相关设备,用于节约网络传输资源,提高模型数据压缩率。本发明实施例方法包括:计算目标模型与参考模型中的同种类型参数之间的差量数据;采用预设压缩算法对所述差量数据进行压缩得到目标压缩文件;将所述目标压缩文件发送给目标终端设备,以使得所述目标终端设备根据所述差量数据以及本地存储的所述参考模型恢复所述目标模型。
-
公开(公告)号:CN109981110B
公开(公告)日:2023-03-24
申请号:CN201910164475.7
申请日:2019-03-05
Applicant: 哈尔滨工业大学(深圳)
IPC: H03M7/40
Abstract: 本发明提供了一种带有逐点相对误差界限的有损压缩的方法,包括以下步骤:A、制表,根据误差要求以及量化因子的区间来制表;B、获取量化因子;C、哈夫曼编码,通过哈夫曼编码来压缩步骤B中生成的量化因子序列;D、使用无损压缩方法,使用无损压缩方法来压缩步骤C生成的哈夫曼编码和哈夫曼树。本发明的有益效果是:可以避免带有逐点相对误差界限的有损压缩中耗时的对数变换,并通过查表来获取量化因子值,极大地加速了带有逐点相对误差界限的有损压缩。
-
-
-
-
-
-
-
-
-