-
公开(公告)号:CN114625760B
公开(公告)日:2024-09-03
申请号:CN202210137615.3
申请日:2022-02-15
Applicant: 北京大学 , 中兴通讯股份有限公司
IPC: G06F16/2453 , G06F16/25
Abstract: 本发明涉及一种基于连接简图的数据库连接基数估计方法和系统。该方法的步骤包括:利用元素过滤器,将数据库表中的元素分为热元素与冷元素;将热元素存储至热元素表中,将冷元素存储至冷元素Sketch中;分别计算两个数据库表的热元素表的连接基数、冷元素Sketch的连接基数以及热元素表和冷元素Sketch的连接基数,并相加,得到对该两个数据库表的连接基数的估计结果。本发明通过将热元素和冷元素分离,可以提高对数据库连接基数估计的精度,且算法的时间和空间开销都有所下降;精确的连接基数估计,有利于数据库管理系统给出最佳的连接顺序,从而提升数据库复杂查询的性能。
-
公开(公告)号:CN114969023A
公开(公告)日:2022-08-30
申请号:CN202210150431.0
申请日:2022-02-18
Applicant: 北京大学 , 中兴通讯股份有限公司
Abstract: 本发明涉及一种数据库学习型索引构建方法和系统。该方法包括:根据数据关键字和数据存储位置,构建累积分布函数;利用机器学习模型拟合累积分布函数,以获取数据关键字与数据存储位置的关联性,得到学习型索引;根据学习型索引,快速定位待查询的键值所处的位置。本发明能够克服现有的B树数据库索引算法调节难度高自适应能力差、辅助数据结构内存空间占用偏大的问题,能够有效地减少辅助数据结构的内存占用、提高数据库索引的自适应调节能力。
-
公开(公告)号:CN114510474A
公开(公告)日:2022-05-17
申请号:CN202210153039.1
申请日:2022-02-18
Applicant: 中兴通讯股份有限公司 , 北京大学
IPC: G06F16/215 , G06F16/901
Abstract: 本发明公开了一种基于时间衰减的样本删除方法及其装置、存储介质,其中,基于时间衰减的样本删除方法包括:获取多个样本;将样本保存至存储空间,其中,存储空间对应有存储属性,存储属性随着存储空间保存样本的存储时间而改变,不同的存储属性对应有不同的预设删除容量,同一存储属性所对应的预设删除容量随着存储时间而衰减;计算归属于目标存储属性的存储空间中的各个样本的热度值;根据热度值和存储空间的当前预设删除容量,删除存储空间中的样本。根据样本的热度值以及存储空间的预设删除容量删除陈旧的样本,相较于现有技术仅根据样本存储时间的远近删除样本的方案,本发明能够保留陈旧样本中有价值的数据,从而有效提高样本的质量。
-
公开(公告)号:CN114510474B
公开(公告)日:2024-06-18
申请号:CN202210153039.1
申请日:2022-02-18
Applicant: 中兴通讯股份有限公司 , 北京大学
IPC: G06F16/215 , G06F16/901
Abstract: 本发明公开了一种基于时间衰减的样本删除方法及其装置、存储介质,其中,基于时间衰减的样本删除方法包括:获取多个样本;将样本保存至存储空间,其中,存储空间对应有存储属性,存储属性随着存储空间保存样本的存储时间而改变,不同的存储属性对应有不同的预设删除容量,同一存储属性所对应的预设删除容量随着存储时间而衰减;计算归属于目标存储属性的存储空间中的各个样本的热度值;根据热度值和存储空间的当前预设删除容量,删除存储空间中的样本。根据样本的热度值以及存储空间的预设删除容量删除陈旧的样本,相较于现有技术仅根据样本存储时间的远近删除样本的方案,本发明能够保留陈旧样本中有价值的数据,从而有效提高样本的质量。
-
公开(公告)号:CN114625760A
公开(公告)日:2022-06-14
申请号:CN202210137615.3
申请日:2022-02-15
Applicant: 北京大学 , 中兴通讯股份有限公司
IPC: G06F16/2453 , G06F16/25
Abstract: 本发明涉及一种基于连接简图的数据库连接基数估计方法和系统。该方法的步骤包括:利用元素过滤器,将数据库表中的元素分为热元素与冷元素;将热元素存储至热元素表中,将冷元素存储至冷元素Sketch中;分别计算两个数据库表的热元素表的连接基数、冷元素Sketch的连接基数以及热元素表和冷元素Sketch的连接基数,并相加,得到对该两个数据库表的连接基数的估计结果。本发明通过将热元素和冷元素分离,可以提高对数据库连接基数估计的精度,且算法的时间和空间开销都有所下降;精确的连接基数估计,有利于数据库管理系统给出最佳的连接顺序,从而提升数据库复杂查询的性能。
-
公开(公告)号:CN119299352A
公开(公告)日:2025-01-10
申请号:CN202411418939.X
申请日:2024-10-11
IPC: H04L43/0876 , H04L43/50
Abstract: 本公开涉及一种网络测量方法、装置、介质、电子设备和程序产品,属于网络技术领域,能够全量获取待测量流的流标识,提升网络测量的准确性。一种网络测量方法,包括:检测待测量流的流量统计特征信息;检测所述待测量流的关键报文,得到所述待测量流的流标识,其中,所述关键报文为能够标识所述待测量流的报文;基于所述流量统计特征信息和所述流标识,确定网络测量结果。
-
公开(公告)号:CN119030902A
公开(公告)日:2024-11-26
申请号:CN202310593825.8
申请日:2023-05-24
IPC: H04L43/0876 , H04L43/0894
Abstract: 本申请提供了一种数据流的特征确定方法、装置、设备及存储介质。在实施例中,接收数据流,数据流包括元素,数据流被划分为多个子数据流,多个子数据流中的每个子数据流对应一个窗口;将元素映射至平滑数据结构的第二单元的桶中,并在桶中存储元素在当前窗口的第一频数;在第二单元的桶中存储有多个元素在连续的p个窗口中的第一频数的情况下,根据多个元素各自在p个窗口中的第一频数,从多个元素中确定平滑元素;其中,元素在p个窗口的第一频数在桶的同一行。根据本实施例,能够通过平滑数据结构,能够实时、准确地确定数据流中的平滑元素,体现数据流的特征。
-
公开(公告)号:CN113626678B
公开(公告)日:2024-10-15
申请号:CN202010372955.5
申请日:2020-05-06
Applicant: 北京大学
IPC: G06F16/9535 , G06F16/951 , G06F18/23213
Abstract: 本发明公开了一种基于动态次优最小生成树的知识图谱数据挖掘与推荐方法,其步骤为:1)根据查询条件对应的子图,在知识图谱进行同构子图匹配,得到若干查询结果;然后将每一查询结果抽象为一个结点;2)将每一查询结果的重要程度作为该查询结果中各个实体的重要程度之和作为对应结点的权值,以查询结果之间的相异程度作为边权值,构建查询结果的最小生成树;3)对该最小生成树中的边进行切割,形成多个不同的连通分支,每个连通分支分别返回该连通分支中重要程度最高的结点作为查询结果输出。本发明可以同时兼顾推进内容的重要性与多样性的方法,而且能够减少用户的等待时间。
-
公开(公告)号:CN117459427A
公开(公告)日:2024-01-26
申请号:CN202210842987.6
申请日:2022-07-18
IPC: H04L43/0829
Abstract: 公开了一种丢包检测方法以及相关设备,以灵活地对需要检测的网络的丢包情况进行检测。该方法包括:控制设备获取来自第一网络中所有的边缘网络设备的第一统计信息和第二统计信息。其中,每一边缘网络设备为数据流进入和/或离开第一网络所经过的设备。第一统计信息和第二统计信息为边缘网络设备的sketch中存储的数据。第一统计信息为通过边缘网络设备进入第一网络的数据流的统计信息,第二统计信息为通过边缘网络设备离开第一网络的数据流的统计信息。第一网络为根据丢包检测的需求确定的网络。控制设备根据所有的边缘网络设备的第一统计信息和第二统计信息,获得第一网络中的丢包信息。
-
公开(公告)号:CN108304404B
公开(公告)日:2022-02-11
申请号:CN201710022519.3
申请日:2017-01-12
Applicant: 北京大学
IPC: G06F16/2453 , G06F16/2455 , G06F16/2458
Abstract: 本发明涉及一种基于改进的Sketch结构的数据频率估计方法。该方法在片内内存设置用于快速查询的第一sketch数据结构,在片外内存设置用于支持插入操作的第二sketch数据结构和用于支持删除操作的第三sketch数据结构;在进行查询操作时,仅查询第一sketch数据结构,得到数据出现频率的估计值;在进行插入操作和删除操作时,通过第二sketch数据结构和第三sketch数据结构辅助第一sketch数据结构中计数的更新。本发明能够在占用片上存储空间不变、查询速率不降低且支持删除操作的前提下,显著提升sketch计数的精确度。
-
-
-
-
-
-
-
-
-