-
公开(公告)号:CN117668000A
公开(公告)日:2024-03-08
申请号:CN202311812966.0
申请日:2023-12-26
Applicant: 华中科技大学
IPC: G06F16/2453 , G06F18/214 , G06N5/01 , G06N3/082 , G06F16/22
Abstract: 本发明公开了一种基于二叉决策树的数据库范围过滤器设计方法和装置,属于数据库查询技术领域,所述方法考虑到在多数应用场景下数据库中需要处理的数据集并不均匀,根据数据集自身分布特点离线构建初始二叉决策树,其每个结点是一个范围,其根结点代表整个数据集中键的范围区间;利用初始二叉决策树进行模拟在线查询并根据各个叶子结点的访问频次进行剪枝;最后进行压缩编码得到数据库范围过滤器;构建二叉决策树过程中根据数据密度以及偏斜程度生长二叉树,可以解决在数据分布不均匀的情况下假阳率较高的问题;根据访问频率对二叉树进行剪枝操作可以减少空间占用;最终得到数据库范围过滤器在数据不均匀情况下能够高效地进行数据处理。
-
公开(公告)号:CN110689038B
公开(公告)日:2024-02-02
申请号:CN201910759050.0
申请日:2019-06-25
Applicant: 深圳市腾讯计算机系统有限公司 , 华中科技大学
IPC: G06V10/774 , G06V10/82 , G06N3/045 , G06N3/0895 , G06N3/0464 , G06N3/0985
Abstract: 本公开涉及人工智能领域中基于神经网络的计算机视觉技术。具体地,提供了一种神经网络模型的训练方法、装置和医学图像处理系统。训练方法包括:利用第一训练样本集执行初始训练,获得初始神经网络模型;利用初始神经网络模型对第二训练样本集执行预测,获得第二训练样本集中每个的预测结果;基于预测结果,从第二训练样本集确定多个优选样本;接收对于多个优选样本的标注结果,将标注后的多个优选样本加入第一训练样本集,获得扩展的第一训练样本集;利用扩展的第一训练样本集执行更新训练,以获得更新的神经网络模型;在满足训练结束条件时,结束训练;在不满足训练结束条件时,重复(56)对比文件CN 109840588 A,2019.06.04CN 109840913 A,2019.06.04US 2018165810 A1,2018.06.14US 2018330198 A1,2018.11.15US 2018330205 A1,2018.11.15US 2019102878 A1,2019.04.04邰建豪.深度学习在遥感影像目标检测和地表覆盖分类中的应用研究《.中国博士学位论文全文数据库 (基础科学辑)》.2019,(第2期),第A008-13页.Xiaocheng Xu, et.al.Weakly supervisedimage parsing by discriminativelysemantic graph propagation《. IEEEInternational Conference on Multimediaand Expo (ICME)》.2016,第1-6页.顾攀等.基于神经网络的图像弱监督语义分割算法《.计算机应用与软件》.2018,第35卷(第2期),第284-288页.丁英姿等.基于弱监督的改进型GoogLeNet在DR检测中的应用《.计算机应用》.2019,第39卷(第8期),第2484-2488页.Praveer Singh, et.al.Improvingrecognition of complex aerial scenesusing a deep weakly supervised learningparadigm《.IEEE geoscience and remotesensing letters》.2018,第15卷(第2期),第1932-1936段.SA Shahriyar, et.al.An approach formulti label image classification usingsingle label convolutional neuralnetwork《.21st International conference ofcomputer and information technology》.2019,
-
公开(公告)号:CN117215767A
公开(公告)日:2023-12-12
申请号:CN202310945035.1
申请日:2023-07-28
Applicant: 华中科技大学 , 深圳市腾讯计算机系统有限公司
Abstract: 本申请实施例公开了一种分布式数据库系统的负载均衡方法和系统,该方法包括:在分布式数据库系统中确定负载异常的源节点;为所述数据分片的主副本和从副本所在的节点分别创建结点,为所述数据分片创建用于连接主副本所在结点和从副本所在结点的有向边,得到副本主从关系图,进而能够在所述副本主从关系图中,通过目标有向边快速地确定第一目的节点、待切换节点以及待切换主副本,提升切换计划的生成效率,切换计划被执行后,能够以均衡代价较小的主从角色切换的方式实现负载转移,提高节点间的负载均衡程度,可广泛应用于云技术、人工智能、智慧交通、辅助驾驶等场景。
-
公开(公告)号:CN116668083A
公开(公告)日:2023-08-29
申请号:CN202310503241.7
申请日:2023-05-06
Applicant: 华中科技大学
Abstract: 本发明公开了一种网络流量异常检测方法及系统,属于网络流量异常检测技术领域;针对网络流量的上下文依赖以及不同特征空间维度的相关性,设计自适应的滑动窗口机制,当数据中存在大量异常,通过维护部分历史正常样本分布,能够有效降低异常检测的漏报率;同时该机制能够动态更新正常网络流量特征的联合分布,进而能够全面捕获正常网络流量的变化模式,有效降低异常检测的误报率。并且在这个过程中,考虑到Vine Copula函数不要求网络流量特征符合特定的分布类型,从而消解了先验假设,更贴近网络流量特征的实际分布,通过引入VineCopula函数来拟合历史窗口内正常样本的分布,能够精确建立网络流量不同特征间的耦合关系,能够高效精确地进行网络流量异常检测。
-
公开(公告)号:CN116382908A
公开(公告)日:2023-07-04
申请号:CN202310348266.4
申请日:2023-04-03
Applicant: 华中科技大学
IPC: G06F9/50 , G06F18/243 , G06N5/01
Abstract: 本发明公开了一种基于机器学习探测低效使用缓存空间租户的方法,包括以下步骤:采集租户的租户缓存信息,并先后对该租户的租户缓存信息进行向量化处理和归一化处理,以获取该租户对应的多个特征向量,将得到的租户的特征向量输入到预先训练好的机器学习模型中,以获取该租户的探测结果。本发明能够解决现有静态探测技术在租户访问模式发生改变后探测准确度不高,不适用于云环境下动态多变的工作负载模式的技术问题,以及现有动态探测技术受限于构建缺失率曲线需要花费大量的时间,无法适用于云环境下实时探测的场景的技术问题,以及当租户数量庞大的情况下,动态探测技术开销庞大的技术问题。
-
公开(公告)号:CN116127119A
公开(公告)日:2023-05-16
申请号:CN202310002357.2
申请日:2023-01-03
Applicant: 华中科技大学
IPC: G06F16/583 , G06V10/44 , G06V10/75 , G06V10/82 , G06N3/0455
Abstract: 本发明公开了一种基于对象规模感知的多标签图像检索方法,其利用感知图像对象规模的哈希质心,构建了一个具有较高检索性能的端到端多标签图像检索方法。本发明提出的方法首先利用Swin Transformer骨干网络作为图像特征提取器,用标签语义信息指导哈希中心点的生成,并提出与对象规模相关的标签亲和度系数的计算方法,二者共同生成包含了对象规模的哈希质心。这些哈希质心作为汉明空间中的锚点,引导多标签图像哈希码不断靠近其对应哈希质心,通过不断的优化基于中心相似性损失函数,使得模型学习到良好的哈希映射关系。本发明使用的哈希质心包含了图像中不同对象的规模信息,结合Swin Transformer骨干网络的强大特征提取能能力,大大提高了图像检索方法的检索性能。
-
公开(公告)号:CN110097130B
公开(公告)日:2022-12-13
申请号:CN201910377510.3
申请日:2019-05-07
Applicant: 深圳市腾讯计算机系统有限公司 , 华中科技大学
Abstract: 本申请公开了一种分类任务模型的训练方法、装置、设备及存储介质,涉及机器学习技术领域,所述方法包括:采用第一数据集训练初始的特征提取器,该第一数据集是类别不均衡数据集;构建生成对抗网络,该生成对抗网络包括特征提取器、特征生成器和域分类器;采用第二类别样本对生成对抗网络进行训练,得到完成训练的特征生成器;构建分类任务模型,该分类任务模型包括完成训练的特征生成器、特征提取器和分类器;采用第一数据集对分类任务模型进行训练;其中,完成训练的特征生成器用于对第二类别样本在特征空间进行扩增。本申请通过特征生成器对少数类别样本在特征空间进行扩增,提高最终训练得到的分类任务模型的精度。
-
公开(公告)号:CN111782491B
公开(公告)日:2022-03-22
申请号:CN201911122229.1
申请日:2019-11-15
Applicant: 华中科技大学
Abstract: 本发明公开了一种磁盘故障预测方法、装置、设备及存储介质,所述磁盘故障预测方法包括:数据预处理、磁盘故障预测模型的训练及预测;所述数据预处理包括:将收集到的SMART数据预处理为图像形式的二维表示;所述磁盘故障预测模型的训练及预测包括:利用处理后的数据进行模型训练,采用训练好的模型对后续的SMART数据进行在线预测,所述模型训练采用基于对抗式生成网络的磁盘故障预测模型。本发明的磁盘故障预测方法可以对磁盘使用的整个生命周期的故障进行有效预测。
-
公开(公告)号:CN110209343B
公开(公告)日:2021-12-14
申请号:CN201810814260.0
申请日:2018-07-23
Applicant: 腾讯科技(深圳)有限公司 , 华中科技大学
IPC: G06F3/06
Abstract: 本发明公开了一种数据存储方法、装置、服务器及存储介质,属于互联网技术领域。所述方法包括:当接收到对第一数据的写入请求时,查询第二数据的存储位置;当查询到第二数据存储在第一缓存单元时,将第一数据存储到第二缓存单元中;返回对第一数据的写入结果。本发明基于第一缓存单元和第二缓存单元对数据进行存储,相比于单独采用第二缓存单元的数据存储方式,节省了成本,对于已存储在第一缓存单元中的数据,当再次对该数据进行存储时,将该数据存储到第二缓存单元,不仅提高了数据读写速度,而且减少了对第一缓存单元的数据写入次数,避免了第一缓存单元损坏,提高了数据安全性,该种方式兼顾了成本、数据读写速度及安全性等方面的需求。
-
公开(公告)号:CN113268458A
公开(公告)日:2021-08-17
申请号:CN202110566053.X
申请日:2021-05-24
Applicant: 华中科技大学 , 深圳市腾讯计算机系统有限公司
IPC: G06F16/172 , G06K9/62
Abstract: 本发明公开了一种基于代价敏感分类算法的缓存方法,具体提出了一种大小感知代价敏感的AdaBoost(SAdaCost)算法来预测对象是否会被再次访问,为了尽可能地提高预测性能,SAdaCost引入了两个代价参数,同时考虑了误分类会被再次访问的对象,以及误分类不会被再次访问的较大对象而造成的缓存开销;随后,本发明将SAdaCost与传统缓存置换策略S3LRU相结合,根据分类结果将对象放入S3LRU三段缓存的不同位置,提出了一种基于分类预测的高效缓存方法,在不改变缓存算法复杂度的同时提升缓存命中率;同时,本发明将机器学习的思想引入缓存也给缓存算法研究提供了一种新的研究思路。
-
-
-
-
-
-
-
-
-