-
公开(公告)号:CN118708549A
公开(公告)日:2024-09-27
申请号:CN202410804851.5
申请日:2024-06-21
Applicant: 华中科技大学 , 济南浪潮数据技术有限公司
Abstract: 本发明公开了一种支持富元数据管理的文件系统,涉及电子数字数据处理领域,本发明的文件系统包括注册模块、命名空间查询模块、第一数据管理模块以及第二数据管理模块,其可作为FUSE框架的文件守护进程,借助FUSE框架为用户提供传统文件访问和新增的富元数据管理服务。富元数据管理服务一方面能够提供除POSIX语义以外的元数据的插入、读取、删除和展示操作;另一方面通过自动的包装器打包和挂载操作,将具有相同元数据属性值或内容相近元数据属性值的文件打包成包装器,以虚拟目录方式挂载在文件系统根目录下;随后,用户可通过访问虚拟目录,快速从海量文件中筛选感兴趣的数据。
-
公开(公告)号:CN118585585A
公开(公告)日:2024-09-03
申请号:CN202410726943.6
申请日:2024-06-06
Applicant: 华中科技大学 , 济南浪潮数据技术有限公司
IPC: G06F16/27 , G06F16/2458 , G06F16/22 , G06F18/23
Abstract: 本发明公开了一种面向云数据分析场景的水平数据分区方法,其自适应识别历史查询负载在各属性的热点查询区间、具有局部性的查询模式和离群查询区间,由此对历史查询负载灵活泛化,兼顾未来查询负载与历史查询负载的相似性和差异性;设计了基于概率的成本模型,准确地评估泛化查询负载的开销,并考虑了数据属性间的相关性,以更精确地量化分区动作的收益,从而优化分区决策;设计了基于概率成本模型的两阶段水平分区方法,首先使用轴垂直超平面切割,使得分区方案尽可能细粒度地对齐泛化查询负载,保证数据跳过效率;针对轴垂直超平面切割面对倾斜数据失效的问题,设计了排序二分切割作为补充,增强分区方法鲁棒性的同时,进一步提升数据跳过效率。
-
公开(公告)号:CN119149229A
公开(公告)日:2024-12-17
申请号:CN202411182357.6
申请日:2024-08-26
Applicant: 深圳市腾讯计算机系统有限公司 , 华中科技大学
Abstract: 本申请涉及计算机技术领域,尤其涉及一种数据库的资源调度方法、系统、装置与存储介质,方法包括:数据库集群中存在新创建的初始容器组时,分别确定各节点的节点剩余资源;基于初始容器组关联的至少一个历史容器组的资源占用信息,获得初始容器组的预测需求资源;在节点剩余资源满足预设需求资源的各节点中选取候选节点,对每个候选节点,预测将初始容器组调度至该候选节点后,该候选节点上最新的节点剩余资源的资源倾斜情况;将资源倾斜情况满足预设的资源分布条件的一个候选节点作为目标节点,将初始容器组调度至目标节点。由于本申请会预测容器组放置后节点上剩余资源的倾斜情况,以避免节点上各类资源出现严重倾斜,提高节点的资源利用率。
-
公开(公告)号:CN119088293A
公开(公告)日:2024-12-06
申请号:CN202411080241.1
申请日:2024-08-07
Applicant: 深圳市腾讯计算机系统有限公司 , 华中科技大学
Abstract: 本公开提供了一种数据处理方法、装置、计算机设备及存储介质。方法通过获取目标数据对象的数据元信息和在第一时间段内的第一访问请求信息;将数据元信息和第一访问请求信息输入第一神经网络模型进行数据热度预测,得到目标数据对象在第二时间段内的数据热度信息;将数据元信息以及第一访问请求信息输入第二神经网络模型进行数据有效时长预测,得到目标数据对象对应的数据有效时长;基于数据元信息、数据热度信息以及数据有效时长生成目标数据对象在目标数据存储集群中的数据迁移计划;根据数据迁移计划对目标数据对象在目标数据存储集群中进行数据迁移。该方法可以提升数据迁移的准确性。
-
公开(公告)号:CN111737168B
公开(公告)日:2024-09-20
申请号:CN202010585684.1
申请日:2020-06-24
Applicant: 华中科技大学 , 腾讯科技(深圳)有限公司
IPC: G06F12/0871
Abstract: 本申请实施例公开了一种缓存系统、缓存处理方法、装置、设备及介质,其中方法包括:依照当前时刻检测到的I/O请求,确定当前时刻各存储节点的缓存命中率曲线,在满足缓存处理条件时,基于最新时刻各存储节点的缓存命中率曲线确定目标缓存配置方案,并依照目标缓存配置方案指示的各存储节点的待配缓存空间大小,调整各存储节点对应缓存实例的缓存空间大小。本申请实施例,可依照I/O请求实时分析出各存储节点的缓存命中率曲线,并基于各存储节点的缓存命中率曲线搜索出最佳缓存配置方案,动态调整各缓存实例的缓存空间,有利于实现缓存空间的按需分配,有效提高缓存利用率。
-
公开(公告)号:CN118586400A
公开(公告)日:2024-09-03
申请号:CN202410726329.X
申请日:2024-06-06
Applicant: 华中科技大学
IPC: G06F40/30 , G06F18/214 , G06F18/21 , G06N3/0442 , G06N3/0455 , G06N3/084
Abstract: 本发明公开了一种语义驱动的时间序列预测模型,包括语义信息编码层、嵌入层编码模块、第一变量选择网络、k个第二变量选择网络、τ个第三变量选择网络、静态协编码器模块、LSTM编码模块、LSTM解码模块、k+τ个门控残差网络、多头注意力层、以及输出层(其为全连接层),语义信息编码层的输入是使用词袋技术和TF‑IDF技术对文本特征进行处理后得到的维度为bs×1×c的文本特征矩阵,其对该文本特征矩阵进行维度变换处理,输出维度为bs×1×h的语义特征矩阵。其中bs为离线训练过程中预先设置的批量数据大小。本发明能够解决现有时间序列预测模型由于缺乏语义信息处理能力和缺乏输入多样性考虑导致的准确性低和泛化性不佳的技术问题,以及缺乏特征可解释性能力的问题。
-
公开(公告)号:CN115130032B
公开(公告)日:2024-07-09
申请号:CN202210789994.4
申请日:2022-07-05
Applicant: 华中科技大学
IPC: G06F16/957 , G06F16/958
Abstract: 本发明公开了一种异构粒度存储系统中的缺失率曲线构建方法,包括:接收访问请求序列,并设置计数器i=1,判断i是否等于访问请求序列中的访问请求总数,如果不等于则将访问请求序列中的第i条访问请求载入缓存过滤器中,并判断该第i条访问请求对应的访问对象是否在缓存过滤器中命中,如果没有则根据第i条访问请求对应的访问对象的大小获取该访问对象的采样率,根据得到的第i条访问请求对应的访问对象的采样率对该访问对象进行采样,并计算该访问对象的重用距离,设置计数器i=i+1。本发明能够解决现有异构粒度存储系统中由于内容流行度差异以及对象大小差异,从而导致的字节缺失率曲线与对象缺失率曲线构建不准确的技术问题。
-
公开(公告)号:CN118278500A
公开(公告)日:2024-07-02
申请号:CN202410524935.3
申请日:2024-04-29
Applicant: 华中科技大学
IPC: G06N3/096 , G06F16/182 , G06F9/50 , G06N20/00 , G06N3/006 , G06F18/214 , G06F18/24 , G06F17/18
Abstract: 本发明公开了一种在DFS中通过基于负载感知的目录级迁移的方法,首先通过机器学习模型分析负载信息以提前发现热点目录,随后,综合预测出的目录热度和系统节点状态情况,提出迁移代价分析模型衡量迁移数据的必要性和紧急度,进而确定何时触发迁移或容忍不均的情况,然后,为了更好的利用局部性,设计了同级目录协同迁移机制,最后,采用多目标优化的方法来恰当的选择所要迁入的存储节点。本发明能解决现有文件级数据迁移方法由于在迁移过程中引入过多的指针,导致增加额外开销的技术问题,在迁移过程中文件的热度消失很快,导致频繁的文件级迁移操作过程中出现很多无效迁移的技术问题,以及由于不能够充分发现热点数据,导致迁移效率低的技术问题。
-
公开(公告)号:CN117806991A
公开(公告)日:2024-04-02
申请号:CN202311783796.8
申请日:2023-12-21
Applicant: 华中科技大学
IPC: G06F12/123
Abstract: 本发明公开了一种基于对象大小感知的自适应缓存插入方法及系统,属于缓存替换技术领域。首先提出了一种影子缓存的机制,能够利于追溯和感知从真实缓存中淘汰对象的历史状态,辅助整个插入策略的精准高效实施;在此基础上,提出了一种新的自适应对象插入策略,通过基于淘汰对象感知访问对象的大小倾向性的算法和记录对象出入情况的影子缓存,动态的调整新入对象的插入位置,在给潜在的零重复使用对象至少一次机会的同时减少零重用对象的驻留几率,提高对象命中率。同时本发明可以动态根据自适应的大小阈值,以几乎忽略不计的开销来适应内容分发网络中动态变化的工作负载,提升缓存性能,特别是在缓存资源有限的场景中减少用户访问延迟和回源带宽。
-
公开(公告)号:CN116962204A
公开(公告)日:2023-10-27
申请号:CN202310916502.8
申请日:2023-07-24
Applicant: 华中科技大学
IPC: H04L41/14 , G06N20/20 , H04L41/16 , H04L41/147 , H04L67/1097
Abstract: 本发明公开了一种基于机器学习降低内容分发网络租户尾延时的方法,包括以下步骤:接收来自请求端的多个租户负载请求所组成的租户负载请求序列{R1,R2,…,Rk},先后对所有租户负载请求进行向量化处理和归一化处理,以获取所有租户负载请求对应的多个特征向量,将所有租户负载请求对应的多个特征向量输入到预先训练好的机器学习模型中,以获取所有租户负载请求对应的多个预测结果,根据所有租户负载请求对应的多个预测结果获取每个租户负载请求对应的租户缓存分区的尾延时敏感度。本发明能够解决CDN云厂商现有缓存空间静态分配方法在租户访问模式发生改变后造成租户缓存分区缓存资源低配或超配的技术问题。
-
-
-
-
-
-
-
-
-