-
公开(公告)号:CN108446340A
公开(公告)日:2018-08-24
申请号:CN201810174542.9
申请日:2018-03-02
Applicant: 哈尔滨工业大学(威海) , 威海翰宝网络科技有限公司
Abstract: 本发明公开了一种面向海量小文件的用户热点数据访问预测方法,从用户访问数据的特点入手,根据文件访问的关联性特点,使用用户相关的分布式海量小文件存储系统文件访问日志,训练Skip-Gram模型,对文件的上下文访问特征进行提取,使用K-means算法对文件特征聚类,对访问相似度高的文件进行集中分析,训练GRU模型,对文件间的关联性进行分析,并根据用户当前访问文件所属类别序列进行预测,将用户未来可能访问文件类别中的全部文件预取至缓存,减少了系统的I/O次数,整体上提升了分布式海量小文件存储系统读取效率。
-
公开(公告)号:CN106528451B
公开(公告)日:2019-09-03
申请号:CN201611001521.4
申请日:2016-11-14
Applicant: 哈尔滨工业大学(威海) , 威海翰宝网络科技有限公司
IPC: G06F12/0862
Abstract: 公开了针对小文件的二级缓存预取的云存储框架及构建方法,其中云存储框架包括:对象存储器、关联性计算模块、数据合并模块、存储节点缓存模块和代理节点缓存模块。本发明首先计算不同对象之间的关联性,并将关联度高的对象合并为一个数据集合,通过对这些数据集合进行缓存来达到数据预取的目的。一方面可以将随机磁盘访问转变为连续磁盘访问,提高存储系统的效率;另一方面通过一次性将对象集合转入代理节点缓存模块进行预读,能够节省网络开销;另外将关联度高的小文件合并也减少了元数据的数量,减少对象访问时元数据的操作时间。
-
公开(公告)号:CN106776967B
公开(公告)日:2020-03-27
申请号:CN201611104325.X
申请日:2016-12-05
Applicant: 哈尔滨工业大学(威海) , 威海翰宝网络科技有限公司
IPC: G06F16/182 , G06F16/172 , G06F16/13
Abstract: 本发明涉及一种基于时序聚合算法的海量小文件实时存储方法及装置,其解决了现有分布式文件系统用于海量小文件时存在的存储效率低的技术问题,其采用数据聚合策略以数据的时间特性定义聚合空间,完成时序数据合并存储,通过将随机写转化为顺序写,本发明可广泛应用于海量小文件的存储。
-
公开(公告)号:CN106776967A
公开(公告)日:2017-05-31
申请号:CN201611104325.X
申请日:2016-12-05
Applicant: 哈尔滨工业大学(威海) , 威海翰宝网络科技有限公司
IPC: G06F17/30
Abstract: 本发明涉及一种基于时序聚合算法的海量小文件实时存储方法及装置,其解决了现有分布式文件系统用于海量小文件时存在的存储效率低的技术问题,其采用数据聚合策略以数据的时间特性定义聚合空间,完成时序数据合并存储,通过将随机写转化为顺序写,本发明可广泛应用于海量小文件的存储。
-
公开(公告)号:CN108446340B
公开(公告)日:2019-11-05
申请号:CN201810174542.9
申请日:2018-03-02
Applicant: 哈尔滨工业大学(威海) , 威海翰宝网络科技有限公司
IPC: G06F16/172 , G06F16/182 , G06K9/62
Abstract: 本发明公开了一种面向海量小文件的用户热点数据访问预测方法,从用户访问数据的特点入手,根据文件访问的关联性特点,使用用户相关的分布式海量小文件存储系统文件访问日志,训练Skip‑Gram模型,对文件的上下文访问特征进行提取,使用K‑means算法对文件特征聚类,对访问相似度高的文件进行集中分析,训练GRU模型,对文件间的关联性进行分析,并根据用户当前访问文件所属类别序列进行预测,将用户未来可能访问文件类别中的全部文件预取至缓存,减少了系统的I/O次数,整体上提升了分布式海量小文件存储系统读取效率。
-
公开(公告)号:CN109992725A
公开(公告)日:2019-07-09
申请号:CN201910285507.9
申请日:2019-04-10
Applicant: 哈尔滨工业大学(威海) , 威海翰宝网络科技有限公司
IPC: G06F16/9536 , G06Q50/00
Abstract: 本发明提供一种基于双向距离网络嵌入的社交网络表示方法,属于数据挖掘与网络技术领域。本发明首先读取社交关系网络中的节点并进行编码;然后读取关注与被关注关系,分别为每一个节点生成窗口大小为k的上文邻居节点序列和下文邻居节点序列,并记录每个邻居节点到该节点的有向距离;构造三层网络嵌入模型;将节点编码集作为输入进行学习,并不断进行模型超参数的调整;最后将隐藏层的权重矩阵作为最终网络嵌入的结果,每一行的向量表示作为节点的向量表示。本发明解决了现有社交关系网络的结构和拓扑信息表示不准确,对真实社交关系的还原能力较低,将不能有效的处理网络数据并精准有效的控制事件的发展的问题。本发明可用于社交网络表示。
-
公开(公告)号:CN106528451A
公开(公告)日:2017-03-22
申请号:CN201611001521.4
申请日:2016-11-14
Applicant: 哈尔滨工业大学(威海) , 威海翰宝网络科技有限公司
IPC: G06F12/0862
Abstract: 公开了针对小文件的二级缓存预取的云存储框架及构建方法,其中云存储框架包括:对象存储器、关联性计算模块、数据合并模块、存储节点缓存模块和代理节点缓存模块。本发明首先计算不同对象之间的关联性,并将关联度高的对象合并为一个数据集合,通过对这些数据集合进行缓存来达到数据预取的目的。一方面可以将随机磁盘访问转变为连续磁盘访问,提高存储系统的效率;另一方面通过一次性将对象集合转入代理节点缓存模块进行预读,能够节省网络开销;另外将关联度高的小文件合并也减少了元数据的数量,减少对象访问时元数据的操作时间。
-
公开(公告)号:CN112083877B
公开(公告)日:2023-05-09
申请号:CN202010507955.1
申请日:2020-06-05
Applicant: 哈尔滨工业大学(威海) , 苏州玄盾汽车科技有限公司
IPC: G06F3/06
Abstract: 一种车辆物联网云存储系统数据分组方法,涉及分布式数据管理技术领域,从车辆物联网分布式存储系统的访问特征入手,根据云存储系统数据访问的时间空间局部性,将具有强访问关联关系的数据进行分组。首先,通过模拟有限缓存空间下的数据的访问,获得缓存快照并建立缓存事务。其次,建立基于缓存事务的向量化数据访问特征,对数据进行初步分组。最后,以初步分组为点,数据间访问强度为边,按照访问强度从高到低的顺序建立关系图,动态的将形成的完全子图合并成数据分组。当数据分组中任何数据被访问时,其所在分组将被一起预取到缓存中。此方法减少了数据访问时的I/O次数和访问延时,整体上提升了车辆物联网云存储系统的数据读取效率。
-
公开(公告)号:CN112083877A
公开(公告)日:2020-12-15
申请号:CN202010507955.1
申请日:2020-06-05
Applicant: 哈尔滨工业大学(威海) , 苏州玄盾汽车科技有限公司
IPC: G06F3/06
Abstract: 一种车辆物联网云存储系统数据分组方法,涉及分布式数据管理技术领域,从车辆物联网分布式存储系统的访问特征入手,根据云存储系统数据访问的时间空间局部性,将具有强访问关联关系的数据进行分组。首先,通过模拟有限缓存空间下的数据的访问,获得缓存快照并建立缓存事务。其次,建立基于缓存事务的向量化数据访问特征,对数据进行初步分组。最后,以初步分组为点,数据间访问强度为边,按照访问强度从高到低的顺序建立关系图,动态的将形成的完全子图合并成数据分组。当数据分组中任何数据被访问时,其所在分组将被一起预取到缓存中。此方法减少了数据访问时的I/O次数和访问延时,整体上提升了车辆物联网云存储系统的数据读取效率。
-
-
-
-
-
-
-
-