一种k代表G-Skyline查询方法

    公开(公告)号:CN118013086A

    公开(公告)日:2024-05-10

    申请号:CN202410423950.9

    申请日:2024-04-10

    Abstract: 本发明属于数据查询技术领域,尤其涉及一种k代表G‑Skyline查询方法。一种k代表G‑Skyline查询方法,包括以下步骤:(1)数据预处理:构建预排序表;(2)求候选元组:扫描预排序表,筛选得到候选元组集;(3)求突出G‑Skyline组:对候选元组集中的候选元组进行运算,获得突出G‑Skyline组;(4)求k代表G‑Skyline组:从突出G‑Skyline组中筛选得到k代表G‑Skyline组。本发明基于预排序和层次剪枝策略,能够快速得到高质量的查询结果;并首次以遗憾率作为代表组评估标准,评估用户对查询结果的满意度,提高了用户友好性。

    基于条件生成模型的近似查询处理算法

    公开(公告)号:CN113177078B

    公开(公告)日:2022-06-17

    申请号:CN202110487805.3

    申请日:2021-04-30

    Abstract: 本发明属于信息检索技术领域,具体涉及一种近似查询处理算法。基于条件生成模型的高效近似查询处理算法,包括:采用聚集预计算获得用户查询的预聚集值;对用户查询进行处理,获得估计用户查询与预聚集范围之间差异的新查询newQ以及选择的预聚集值;构建基于Wasserstein的条件变分生成对抗网络模型,利用训练完成的模型为新查询newQ生成数据样本;对生成的数据样本进行过滤,并将过滤后的数据样本与选择的预聚集值相结合,计算得到最终的查询估计值。本发明的方法构建了一种高效的深度生成模型,并引入Wasserstein距离作为误差衡量,消除模型坍塌;将该模型应用于近似查询,并与聚集预计算相结合,同时采用表决算法,降低近似查询误差。

    一种偏好性G-Skyline查询方法

    公开(公告)号:CN119557345B

    公开(公告)日:2025-04-11

    申请号:CN202510121405.9

    申请日:2025-01-26

    Abstract: 本发明属于数据查询技术领域,涉及一种偏好性G‑Skyline查询方法。该方法包括三个步骤:(1)求初步的候选元组:扫描预排序表PT筛选得到全部的组成G‑Skyline组的候选元组;(2)求精简的候选元组:基于用户指定的偏好元组,剔除冗余候选元组得到精简的候选元组;(3)求偏好G‑Skyline组:基于偏好元组和精简的候选元组求得偏好G‑Skyline组。本发明在求候选元组时,基于G‑Skyline的性质筛选得到初步的候选元组,然后利用剪切定理剔除了冗余的候选元组,减少了候选元组数量;在求偏好G‑Skyline组时,充分利用了偏好元组,采用深度优先搜索思想,使得生成的候选组的数量大大减小。

    基于条件生成模型的高效近似查询处理算法

    公开(公告)号:CN113177078A

    公开(公告)日:2021-07-27

    申请号:CN202110487805.3

    申请日:2021-04-30

    Abstract: 本发明属于信息检索技术领域,具体涉及一种近似查询处理算法。基于条件生成模型的高效近似查询处理算法,包括:采用聚集预计算获得用户查询的预聚集值;对用户查询进行处理,获得估计用户查询与预聚集范围之间差异的新查询newQ以及选择的预聚集值;构建基于Wasserstein的条件变分生成对抗网络模型,利用训练完成的模型为新查询newQ生成数据样本;对生成的数据样本进行过滤,并将过滤后的数据样本与选择的预聚集值相结合,计算得到最终的查询估计值。本发明的方法构建了一种高效的深度生成模型,并引入Wasserstein距离作为误差衡量,消除模型坍塌;将该模型应用于近似查询,并与聚集预计算相结合,同时采用表决算法,降低近似查询误差。

    无线传感器网络覆盖空洞面积的计算方法

    公开(公告)号:CN104135732B

    公开(公告)日:2017-07-21

    申请号:CN201410375384.5

    申请日:2014-07-31

    Abstract: 本发明涉及一种无线传感器网络覆盖空洞面积的计算方法,包括:步骤1,计算出由邻接节点构成的无向图;步骤2,计算出各邻接节点之间的交点;步骤3,根据交点找出空洞的边界节点并构造出空洞的边界图;步骤4,广度遍历边界图,从中找出所有的最小多边形以形成字典D;步骤5,遍历字典D,判断网络中的节点是否被其中的一个最小多边形包围,如果是,则将该最小多边形从字典D中删除;步骤6,计算字典D内的每个最小多边形的面积,如果结果为负则表示没有空洞;否则表示有空洞。本发明能够检测出覆盖空洞的边界和网络的外边界,便于更高效地部署修补节点以用最少的代价维护网络的最高效运行。

    一种具有学习式属性模式的关系数据库错误检测方法

    公开(公告)号:CN119848155A

    公开(公告)日:2025-04-18

    申请号:CN202510322155.5

    申请日:2025-03-19

    Abstract: 本发明属于数据库数据质量管理技术领域,具体涉及一种具有学习式属性模式的关系数据库错误检测方法。步骤:数据预处理,将输入数据序列用数据词元与模式词元交错构建的输入词元表示;错误识别,基于输入词元学习相应属性的属性域间独立和属性域内部共享的特征,并将学习内容存储在可学习模式模块和多头自注意力网络权重中以用于检测;可视化解释,提取多头自注意力网络内的注意力分数,以此构建输入词元和输出预测的关系,生成可视化注意力图。本发明的主要改进是属性模式感知的Transformer框架,学习关系表的数据值和其属性域结构的特征,用于检测给定数据集的数据错误,提高检测任务的准确性和效率,可视化错误检测的过程。

    海量数据中基于后缀划分的高效用高占用比项集挖掘算法

    公开(公告)号:CN114528332B

    公开(公告)日:2024-11-01

    申请号:CN202210060831.2

    申请日:2022-01-19

    Abstract: 本发明公开了海量数据中基于后缀划分的高效用高占用比项集挖掘算法,包括预处理阶段、项集挖掘阶段。预处理阶段包括后缀划分及垂直存储;项集挖掘阶段,依次将每个分区从磁盘读入内存,首先对1‑项集和2‑项集进行计算,判断其是否为高效用高占用比项集;对于长度大于2的项集,构建一个基于链表的双向栈结构存储分区中的拓展项集,再利用双向栈中的项构建一棵集合枚举树,在集合枚举树上按照深度优先搜索的顺序对项集进行遍历挖掘;同时根据支持度向下闭合属性、效用占用比向下闭合属性、3‑项集完全剪枝策略对项集进行剪枝,结合项集链接策略和剩余TID交叉计数策略进行挖掘。本发明有效解决了当前算法无法处理大规模数据集的问题。

    海量数据离群点检测中相关子空间搜索方法

    公开(公告)号:CN118333147B

    公开(公告)日:2024-08-13

    申请号:CN202410774444.4

    申请日:2024-06-17

    Abstract: 本发明属于数据处理技术领域,具体涉及一种海量数据离群点检测中相关子空间搜索方法。该方法主要包括:步骤1,对原始数据进行预处理,构建有序列表集合和哈希分片集合;依次利用预处理得到的所有哈希分片进行自适应相关属性判断,保留无重复的相关属性结果集;步骤2,根据步骤1的结果生成所有候选子空间,并利用预计算的有序列表集合和基于最频繁替换策略的FLA结构进行相关子空间判断;步骤3,对步骤2中结果进行冗余删除并返回所有相关子空间。本发明利用局部敏感哈希索引预先将数据集划分成内存可以容纳的哈希分片,避免了由于内存不足对处理海量数据集的限制;独立验证所有哈希分片进行无关属性剪切,大大减少了候选子空间的数量。

    一种海量不完整数据的skyline查询方法,设备及存储介质

    公开(公告)号:CN109284306B

    公开(公告)日:2021-08-31

    申请号:CN201811039452.5

    申请日:2018-09-06

    Abstract: 本发明提供一种海量不完整数据的skyline查询方法,设备及存储介质,扫描的TSI算法,可以有效地在海量不完整数据上进行skyline的计算处理。TSI通过对表执行两遍扫描来计算出skyline的结果。第一遍扫描的时候TSI忽略了非传递性以及循环支配特性,并且将skyline结果的精化留到第二遍扫描时进行。还针对第一个顺序扫描阶段提出了跳过不必要的元组的方法,进一步地增加了TSI的性能。

    一种用于挖掘电商交易数据中高利润商品的方法

    公开(公告)号:CN112801793A

    公开(公告)日:2021-05-14

    申请号:CN202110132598.X

    申请日:2021-01-31

    Abstract: 本发明属于海量数据挖掘与处理技术领域,涉及电商交易数据中高利润商品的挖掘方法。一种用于挖掘电商交易数据中高利润商品的方法,包括:根据每个商品的前缀不同,将每次交易记录中首个商品作为前缀项,将交易记录中具有相同前缀项的的商品集分在同一个分区里;所述商品集为一项式商品集或二项式商品集;分别计算每个分区的twu值,twu记录了该分区的最大利润效用值,将每个分区的twu值,与用户设定的利润阈值minU比较:a.若twu<minU,则跳过该分区,进入下一个分区;b.若twu≥minU,则计算该分区内每个商品集在整个分区中的利润效用值UIPa[i].twu,并将所有UIPa[i].twu降序排序,从大到小依次与利润阈值minU比较,找到大于等于利润阈值minU的商品集。本发明的方法,性能更优,效率更高。

Patent Agency Ranking