一种基于Transformer的云数据库异常检测方法与系统

    公开(公告)号:CN116796273A

    公开(公告)日:2023-09-22

    申请号:CN202310754770.4

    申请日:2023-06-25

    Abstract: 本发明公开了一种基于Transformer的云数据库异常检测方法,包括以下步骤:获取云数据库的关键性能指标KPI数据,对采集的云数据库的KPI数据进行降维处理,以获取降维处理后的云数据库的KPI数据;对降维处理后的云数据库的KPI数据进行预处理,以获取云数据库KPI样本数据;将获取的云数据库的KPI数据输入预先训练好的云数据库异常检测模型TransAD中,以获取异常检测结果。本发明能够解决现有云数据库异常检测方法忽视由于了云数据库集群的特点,仅考虑了数据库自身不同KPI之间的相关性,而没有考虑数据库之间的相关性,因此无法从集群整体层面来度量数据库的异常状态,因此会导致检测精确率低的技术问题。

    神经网络模型的训练方法、装置和电子设备

    公开(公告)号:CN110245721B

    公开(公告)日:2023-09-05

    申请号:CN201910555746.1

    申请日:2019-06-25

    Abstract: 本公开提供了一种神经网络模型的训练方法和装置、电子设备和计算机可读存储介质。神经网络模型的训练方法包括:利用第一训练样本集执行初始训练,获得初始神经网络模型;利用初始神经网络模型对第二训练样本集执行预测,获得第二训练样本集中每个训练样本的预测结果;基于预测结果,从第二训练样本集确定多个优选样本;接收对于多个优选样本的标注结果,将标注后的多个优选样本加入第一训练样本集,获得扩展的第一训练样本集;利用扩展的第一训练样本集执行更新训练,以获得更新的神经网络模型;在满足训练结束条件的情况下,结束训练;以及在不满足训练结束条件的情况下,重复执行预测步骤、优选样本确定步骤、样本扩展步骤以及更新训练步骤。

    一种多媒体数据的哈希生成模型的构建方法及应用

    公开(公告)号:CN116383415A

    公开(公告)日:2023-07-04

    申请号:CN202310276840.X

    申请日:2023-03-21

    Inventor: 韩凯 刘渝 周可

    Abstract: 本发明公开了一种多媒体数据的哈希生成模型的构建方法及应用,多媒体数据跨模态检索技术领域,包括:S1、接收多媒体数据集;其中,多媒体数据包括图像、以及用于描述图像内容的文本,并携带具有层次结构的层次标签;S2、针对每一个多媒体数据,提取其模态特征,并获取其层次标签中任意相邻两层之间的隶属关系矩阵,基于隶属关系矩阵和层次标签得到每一层的软相似标签,进而得到每一个多媒体数据的哈希码;S3、以各多媒体数据的模态特征为输入,对应的哈希码为输出,对机器学习模型进行训练,得到哈希生成模型。本发明能够充分利用标签层次结构中的信息,生成具有辨别力的哈希码,大大提高了检索的准确性。

    一种基于强化学习的分布式存储系统自动调参方法及系统

    公开(公告)号:CN116088761A

    公开(公告)日:2023-05-09

    申请号:CN202310059553.3

    申请日:2023-01-18

    Abstract: 本发明公开了一种基于强化学习的分布式存储系统自动调参方法及系统,属于分布式存储技术领域;首先通过对第一样本池中的分布式存储系统性能指标进行统计,从而从第一样本池中筛选出对分布式存储系统性能影响较大的多个系统参数,作为分布式存储系统的一组调优参数,以降低优化问题的复杂度,保证了后续基于强化学习的进行调参的可行性;然后,在参数筛选的基础之上,利用强化学习的DDPG模型进行进一步的调优工作,并且在这个过程中,考虑到DDPG模型的前期冷启动耗时问题,采用遗传算法进行前期的样本收集工作,将收集得到的样本输入给DDPG模型进行预训练,从而避免前期冷启动大量耗时的问题,从而能够合理有效地对分布式存储系统参数进行准确调优。

    一种基于标签视觉联合感知的无监督图像检索方法和系统

    公开(公告)号:CN116049467A

    公开(公告)日:2023-05-02

    申请号:CN202310086525.0

    申请日:2023-01-17

    Abstract: 本发明公开了一种基于标签视觉联合感知的无监督图像检索方法,首先获取待检索图像以及图像数据库中的多个图像,使用PIL库将该待检索图像和每个图像分别转换为多维张量,所有多维张量构成多维张量集合,然后将多维张量集合输入预先训练好的检索模型中,以得到待检索图像对应的哈希码,以及每个图像对应的哈希码,针对每个图像对应的哈希码而言,计算其与待检索图像对应的哈希码之间的相似度,其中检索模型包括依次连接的ResNet‑101网络、标签共现嵌入生成网络、视觉相似性嵌入生成网络、双重OGSP网络、自监督网络、以及哈希函数学习网络。本发明能够解决现有无监督多标签图像检索方法无法得到最佳的MAP、进而影响最终检索性能的技术问题。

    一种磁盘故障预测模型的构建方法及应用

    公开(公告)号:CN115934398A

    公开(公告)日:2023-04-07

    申请号:CN202211642693.5

    申请日:2022-12-20

    Abstract: 本发明公开了一种磁盘故障预测模型的构建方法及应用,属于磁盘故障预测技术领域,本发明将磁盘异构、模型老化、环境差异等因素视作数据异构这一因素进行处理,并将磁盘故障预测中的小样本问题看作处理数据异构所导致的结果,通过将采集到的磁盘样本集按照磁盘故障预测中不同因素所对应的属性(磁盘型号、服务器环境、采样时间)进行分层划分,得到多个所包含的故障样本数量基本相当的子样本集,能够很好的平衡数据异构问题和小样本问题,在此基础上,将划分得到的多个子样本集视作多任务,进行多任务学习,实现了多个域下的迁移学习,能够适应多问题混合存在的磁盘故障预测场景,预测精度较高。

    一种高分辨率遥感影像提取建筑物的模型构建方法及应用

    公开(公告)号:CN115601662A

    公开(公告)日:2023-01-13

    申请号:CN202211455618.8

    申请日:2022-11-21

    Abstract: 本发明公开了一种高分辨率遥感影像提取建筑物的模型构建方法及应用,属于遥感影像处理领域。包括:对高分辨率遥感影像进行切片处理;构建胶囊卷积神经网络,提取所述切片处理后的高分辨率遥感影像的浅层特征信息,并从浅层特征图中抽取目标建筑物的一组胶囊;构建胶囊融合模块及线性网络,对融合后的胶囊与所述一组胶囊之间的残差进行变换,得到目标建筑物与各组成部件之间的连接概率,并用连接概率修正先验注意力分布,得到各组成部件的后验注意力分布,拼接所述后验注意力分布,得到目标建筑物的后验注意力分布。上采样后得到从切片处理后的高分辨率遥感影像中预测的目标建筑物;本发明可以提升模型的识别精度及良好的模型泛化能力。

    日志压缩、日志还原方法、装置、计算机设备和存储介质

    公开(公告)号:CN115408350A

    公开(公告)日:2022-11-29

    申请号:CN202210822255.0

    申请日:2022-07-13

    Abstract: 本申请涉及一种日志压缩、日志还原方法、装置、计算机设备、存储介质和计算机程序产品。本发明实施例可应用于云技术、人工智能、智慧交通、辅助驾驶等各种场景。所述方法包括:将模板字符串排列信息和目标日志的字符串排列信息匹配成功的候选日志模板作为初始日志模板;从目标日志的日志字符串中,将与初始日志模板中的变量类模板字符串匹配的日志字符串作为第一初始字符串,将与初始日志模板中的常量类模板字符串匹配的日志字符串作为第二初始字符串;基于初始日志模板对应的模板标识、各个第一初始字符串分别对应的第一编码数据、目标日志中第一初始字符串和第二初始字符串之间的第一位置关系,生成日志压缩数据,以此提高日志压缩率。

    一种面向多负载的云数据库二级索引自动推荐方法和系统

    公开(公告)号:CN113360497A

    公开(公告)日:2021-09-07

    申请号:CN202110579171.4

    申请日:2021-05-26

    Abstract: 本发明公开了一种面向多负载的云数据库二级索引自动推荐方法,其包括:从数据库中的查询语句集合中随机选择多个查询语句组成查询语句样本集{q1,q2,...,qR},对样本集进行向量化处理,以得到查询语句向量组{x1,x2,...,xR},使用k‑means算法对向量组进行聚类分析,以得到k个2*N维向量作为k个查询模板、以及k个查询模板中每一个查询模板的权重,并用这k个查询模板表示整个查询语句集合的特征,将k个查询模板、以及每个查询模板的权重输入到预先训练好的多负载索引推荐模型中,以得到索引配置。本发明能够解决现有基于启发式的方法和机器学习的方法由于模型通用性差、只能为单一查询集合推荐索引配置,导致无法适用于云数据库业务场景的技术问题。

    一种支持高效写的自适应学习索引方法和系统

    公开(公告)号:CN113268457A

    公开(公告)日:2021-08-17

    申请号:CN202110562163.9

    申请日:2021-05-24

    Abstract: 本发明公开了一种支持高效写的自适应学习索引方法(Aaptive Learned Index Supporting Efficient Writes,EWALI)。EWALI方案基于高效的ShrinkingCone算法,能够根据数据分布进行动态数据分片,保证分片后每个数据片内的数据分布趋于线性。EWALI方案实现数据感知递归模型索引DARMI,能够根据数据分布的变化,自适应进行节点拆分、重训练等操作,动态地调整索引结构。为支持更高效的写操作,EWALI方案设计了采用单缓存设计来处理增量数据,将写操作异步化处理,通过后台线程进行数据合并。读操作按照增量缓存、DARMI的顺序查询记录。写操作直接往增量缓存中写入数据,通过后台线程完成数据的合并操作。

Patent Agency Ranking