-
公开(公告)号:CN119669522A
公开(公告)日:2025-03-21
申请号:CN202411734332.2
申请日:2024-11-29
Applicant: 华中科技大学
IPC: G06F16/901 , G06F16/903 , G06F16/583 , G06F16/58 , G06F16/334 , G06N3/042 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本发明公开了图像‑文本跨模态哈希码提取模型建立方法及其应用,属于跨模态检索领域,包括:利用哈希模型分别提取训练集和当前训练批次中的图像的哈希码和文本的哈希码,并建立图像全局图、图像局部图、文本全局图和文本局部图,利用图像局部图重建文本特征,利用文本全局图重建图像特征;建立损失函数,并进行模型训练直至损失函数收敛;损失函数包括:模态内对比损失,用于拉近全局图中相邻哈希码间的距离,并拉远不相邻哈希码间的距离;模态间对比损失,包括全局图中各节点与其相邻节点所匹配的另一模态哈希码间的相似度损失;以及重建损失,包括重建所得特征与原始特征间的损失。本发明能够提高图像‑文本跨模态检索的准确度。
-
公开(公告)号:CN119669190A
公开(公告)日:2025-03-21
申请号:CN202411735949.6
申请日:2024-11-29
Applicant: 华中科技大学
Abstract: 本发明公开了一种基于参数类型定制优化的数据库参数调优方法,属于数据库配置优化领域,该方法包括:将数据库参数空间按照参数类型划分成连续型参数子空间和分类型参数子空间,并将其投影到低维空间,分别低维的连续型参数型子空间和分类型参数子空间中使用GP模型和SMAC模型作为代理模型搜索连续型参数配置和分类型参数配置;通过迭代优化及基于上下文的通信机制,实现了GP模型和SMAC模型的交互;并将参数配置结果映射回数据库参数空间进行性能评估。本发明能够有效提升数据库参数调优性能和效率,允许用户在更短时间内搜索出性能更高的数据库参数配置。
-
公开(公告)号:CN112163106B
公开(公告)日:2024-04-26
申请号:CN202011059408.8
申请日:2020-09-30
Applicant: 华中科技大学
IPC: G06F16/51 , G06F16/583 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种二阶相似感知的图像哈希码提取模型建立方法及其应用,属于图像检索领域,包括:利用预训练模型提取图像数据集中各图像的特征;以特征为节点,以特征间的相似度为对应节点间边的权重,建立图模型,并构建其邻接矩阵;建立同时包含一阶和二阶接近度重构误差的损失函数;以邻接矩阵中的每一行为输入,对自编码器进行训练;在损失函数收敛时,提取自编码器正中间隐藏层的输出,并转换为二进制哈希码,作为对应图像的哈希标签;对图像数据集进行抽样,由抽样得到的图像及其对应的哈希标签构成训练集;利用训练集训练神经网络,得到图像哈希码提取模型。本发明能够修复图像特征中存在的语义偏差,提高图像检索的准确性。
-
公开(公告)号:CN111984807B
公开(公告)日:2024-03-19
申请号:CN202010819959.3
申请日:2020-08-14
Applicant: 华中科技大学
Abstract: 本发明公开了一种内容筛选存储方法及系统,在内容存储阶段,通过预训练好的哈希码生成模型对该图像的局部特征和整体特征进行分析,生成与新图像内容相关联的哈希码,构成元数据,并通过构建语义汉明图对元数据进行管理,在语义汉明图中通过边的连接来关联到相似的节点,并且边长即为关联的权重,在保留关联信息的同时,也最大程度的减少连接边和资源开销,同时也优化了数据查找流程,将文件信息等元数据直接集成在语义汉明图中,不需要依赖其他索引来得到文件信息,从而进一步节约了资源,缩短了延迟时间,使得在内容筛选阶段,可以实现基于内容相似度的数据查询与筛选,只读取与需求内容语义相关的数据,大大减少了读取延迟。
-
公开(公告)号:CN110413807B
公开(公告)日:2021-04-20
申请号:CN201910546661.7
申请日:2019-06-24
Applicant: 华中科技大学
IPC: G06F16/51 , G06F16/583
Abstract: 本发明公开了一种基于内容语义元数据的图像查询方法,包括:将上传的图像文件输入到深度自学习哈希网络中,通过深度自学习哈希处理得到图像对应的语义哈希码;将语义哈希码和图像文件一一对应地上传到存储系统中,并且以此哈希码作为相应图像文件的语义元数据;设置一个两端连接哈希表将具有相同语义哈希值的图像文件用链表链接起来,链表用于组织具有相同语义哈希值的图像文件;通过语义查询接口发起语义查询请求,语义查询接口通过汉明图获取语义查询请求中的语义哈希码;通过两端连接哈希表向所述存储系统发起与语义哈希码相对应的图像文件请求,并返回与语义哈希码相对应的图像文件。实现了基于语义内容的图像文件查询。
-
公开(公告)号:CN111984807A
公开(公告)日:2020-11-24
申请号:CN202010819959.3
申请日:2020-08-14
Applicant: 华中科技大学
Abstract: 本发明公开了一种内容筛选存储方法及系统,在内容存储阶段,通过预训练好的哈希码生成模型对该图像的局部特征和整体特征进行分析,生成与新图像内容相关联的哈希码,构成元数据,并通过构建语义汉明图对元数据进行管理,在语义汉明图中通过边的连接来关联到相似的节点,并且边长即为关联的权重,在保留关联信息的同时,也最大程度的减少连接边和资源开销,同时也优化了数据查找流程,将文件信息等元数据直接集成在语义汉明图中,不需要依赖其他索引来得到文件信息,从而进一步节约了资源,缩短了延迟时间,使得在内容筛选阶段,可以实现基于内容相似度的数据查询与筛选,只读取与需求内容语义相关的数据,大大减少了读取延迟。
-
公开(公告)号:CN110413807A
公开(公告)日:2019-11-05
申请号:CN201910546661.7
申请日:2019-06-24
Applicant: 华中科技大学
IPC: G06F16/51 , G06F16/583
Abstract: 本发明公开了一种基于内容语义元数据的图像查询方法,包括:将上传的图像文件输入到深度自学习哈希网络中,通过深度自学习哈希处理得到图像对应的语义哈希码;将语义哈希码和图像文件一一对应地上传到存储系统中,并且以此哈希码作为相应图像文件的语义元数据;设置一个两端连接哈希表将具有相同语义哈希值的图像文件用链表链接起来,链表用于组织具有相同语义哈希值的图像文件;通过语义查询接口发起语义查询请求,语义查询接口通过汉明图获取语义查询请求中的语义哈希码;通过两端连接哈希表向所述存储系统发起与语义哈希码相对应的图像文件请求,并返回与语义哈希码相对应的图像文件。实现了基于语义内容的图像文件查询。
-
公开(公告)号:CN117806991A
公开(公告)日:2024-04-02
申请号:CN202311783796.8
申请日:2023-12-21
Applicant: 华中科技大学
IPC: G06F12/123
Abstract: 本发明公开了一种基于对象大小感知的自适应缓存插入方法及系统,属于缓存替换技术领域。首先提出了一种影子缓存的机制,能够利于追溯和感知从真实缓存中淘汰对象的历史状态,辅助整个插入策略的精准高效实施;在此基础上,提出了一种新的自适应对象插入策略,通过基于淘汰对象感知访问对象的大小倾向性的算法和记录对象出入情况的影子缓存,动态的调整新入对象的插入位置,在给潜在的零重复使用对象至少一次机会的同时减少零重用对象的驻留几率,提高对象命中率。同时本发明可以动态根据自适应的大小阈值,以几乎忽略不计的开销来适应内容分发网络中动态变化的工作负载,提升缓存性能,特别是在缓存资源有限的场景中减少用户访问延迟和回源带宽。
-
公开(公告)号:CN116383415A
公开(公告)日:2023-07-04
申请号:CN202310276840.X
申请日:2023-03-21
Applicant: 华中科技大学
IPC: G06F16/41 , G06F16/45 , G06F16/483 , G06N20/00
Abstract: 本发明公开了一种多媒体数据的哈希生成模型的构建方法及应用,多媒体数据跨模态检索技术领域,包括:S1、接收多媒体数据集;其中,多媒体数据包括图像、以及用于描述图像内容的文本,并携带具有层次结构的层次标签;S2、针对每一个多媒体数据,提取其模态特征,并获取其层次标签中任意相邻两层之间的隶属关系矩阵,基于隶属关系矩阵和层次标签得到每一层的软相似标签,进而得到每一个多媒体数据的哈希码;S3、以各多媒体数据的模态特征为输入,对应的哈希码为输出,对机器学习模型进行训练,得到哈希生成模型。本发明能够充分利用标签层次结构中的信息,生成具有辨别力的哈希码,大大提高了检索的准确性。
-
公开(公告)号:CN116088761A
公开(公告)日:2023-05-09
申请号:CN202310059553.3
申请日:2023-01-18
Applicant: 华中科技大学
Abstract: 本发明公开了一种基于强化学习的分布式存储系统自动调参方法及系统,属于分布式存储技术领域;首先通过对第一样本池中的分布式存储系统性能指标进行统计,从而从第一样本池中筛选出对分布式存储系统性能影响较大的多个系统参数,作为分布式存储系统的一组调优参数,以降低优化问题的复杂度,保证了后续基于强化学习的进行调参的可行性;然后,在参数筛选的基础之上,利用强化学习的DDPG模型进行进一步的调优工作,并且在这个过程中,考虑到DDPG模型的前期冷启动耗时问题,采用遗传算法进行前期的样本收集工作,将收集得到的样本输入给DDPG模型进行预训练,从而避免前期冷启动大量耗时的问题,从而能够合理有效地对分布式存储系统参数进行准确调优。
-
-
-
-
-
-
-
-
-