-
公开(公告)号:CN114090654B
公开(公告)日:2025-04-01
申请号:CN202111373215.4
申请日:2021-11-19
Applicant: 北京信息科技大学
IPC: G06F16/2458 , G06F16/2455 , G06F16/2453
Abstract: 本发明涉及一种工业时序数据的近似查询处理方法、系统、介质及设备,其包括:将时序数据进行初次压缩,得到满足初始压缩精度的压缩数据;计算所述压缩数据的标准差,根据所述标准差得到压缩精度浮动;根据所述压缩精度浮动调整压缩精度,利用调整好的所述压缩精度重新进行数据压缩,直到压缩精度浮动满足预先设定条件,输出压缩后的数据;将所述压缩后的数据进行近似查询,若查询的压缩点位处于压缩点损失区间内,则对损失点位的数值进行近似估计后再进行近似查询;反之,则直接对压缩后剩余的点位进行存在性查询,得到精确的点位数值。本发明能够在海量的工业时序数据的持续产出的情况下,高效压缩时序数据并且保留数据趋势进行存储的情况。
-
公开(公告)号:CN118673414A
公开(公告)日:2024-09-20
申请号:CN202410778358.0
申请日:2024-06-17
Applicant: 北京信息科技大学
IPC: G06F18/243 , G06Q10/083 , G06Q10/0833 , G06F18/214 , G06N5/01
Abstract: 本发明涉及一种物流运单数据处理领域,公开了一种数据流环境下的物流运单异常检测方法、系统及存储介质,其包括:将物流公司原始运单数据和原始轨迹数据分别进行预处理后,进行正负样本的选取;将负样本和正样本进行整合,生成概念漂移数据集与非概念漂移的数据集,由非概念漂移的数据集模拟运单异常的概念漂移,并从各数据集中选取能够全面反映运单与轨迹之间关系的特征;对选取的特征采用EFAT算法进行处理,得到异常检测结果。本发明检测速度快、准确率高,并具有能抵抗概念漂移的能力。
-
公开(公告)号:CN116415200A
公开(公告)日:2023-07-11
申请号:CN202310395220.8
申请日:2023-04-13
Applicant: 北京信息科技大学
IPC: G06F18/2433 , G06F18/2113 , G06N3/0442 , G06N3/0475 , G06N3/0455 , G06N3/048 , G06N3/0464 , G06N3/09 , G06N3/094 , G08G1/01
Abstract: 本发明涉及一种基于深度学习的异常车辆轨迹异常检测方法及系统,其包括:将获取的车辆轨迹数据进行网格化处理,并对网格化处理后的车辆轨迹数据基于GRU和VAE提取特征向量;将提取到的特征向量输入到构建的GRU‑WGAN模型中,GRU‑WGAN模型包括一个生成器和一个判别器,生成器和判别器均由GRU网络构成;生成器根据输入的特征向量重建轨迹特征点,重建的轨迹特征点与真实数据输入判别器中,由判别器判定轨迹是否异常,并根据判定结果更新生成器和判别器的参数,学习训练特征提取部分的输出和真实数据的潜在特征,得到判别器最优的输出结果,完成车辆轨迹数据异常检测。本发明能有效提高检测准确度,并提高了模型的可解释性和稳定性、有效性。
-
公开(公告)号:CN118673414B
公开(公告)日:2025-02-14
申请号:CN202410778358.0
申请日:2024-06-17
Applicant: 北京信息科技大学
IPC: G06F18/243 , G06Q10/083 , G06Q10/0833 , G06F18/214 , G06N5/01
Abstract: 本发明涉及一种物流运单数据处理领域,公开了一种数据流环境下的物流运单异常检测方法、系统及存储介质,其包括:将物流公司原始运单数据和原始轨迹数据分别进行预处理后,进行正负样本的选取;将负样本和正样本进行整合,生成概念漂移数据集与非概念漂移的数据集,由非概念漂移的数据集模拟运单异常的概念漂移,并从各数据集中选取能够全面反映运单与轨迹之间关系的特征;对选取的特征采用EFAT算法进行处理,得到异常检测结果。本发明检测速度快、准确率高,并具有能抵抗概念漂移的能力。
-
公开(公告)号:CN116938509A
公开(公告)日:2023-10-24
申请号:CN202310397256.X
申请日:2023-04-12
Applicant: 北京信息科技大学
IPC: H04L9/40
Abstract: 本发明涉及一种基于ChatGPT知识增强的网络数据流异常检测方法及系统,其包括:对获取的流式网络数据集进行基于ChatGPT知识增强处理,得到该流式网络数据集所在领域的领域知识,并获取领域知识中数据特征的最大值和最小值;基于当前数据速率与理想速率的关系,确定下一个区间自适应滑动窗口的长度,以得到区间自适应滑动窗口;将领域知识的特征的最大值和最小值融入归一化中,并将整个流式网络数据输入区间自适应滑动窗口对其进行归一化处理,得到当前窗口归一化后的数据点,并将当前窗口归一化后的数据点输入数据异常检测方法中,得到网络数据流异常检测结果。本发明能有效保证数据处理的实时性,提高异常数据的检测准确度;可以在网络安全领域中应用。
-
公开(公告)号:CN116738272A
公开(公告)日:2023-09-12
申请号:CN202310387078.2
申请日:2023-04-12
Applicant: 北京信息科技大学
IPC: G06F18/24 , G06F18/214 , G06Q30/0251 , G06N3/04 , G06N3/08
Abstract: 本发明涉及一种移动广告点击流量中异常数据检测方法及系统,其包括:获取移动广告点击流量表格数据集,分别对数据集中的数值特征和分类特征进行预处理,并随机划分为训练集和测试集;将训练集输入预先构建的异常移动流量表格数据模型中,采用流量表格数据表征学习借口任务,并通过自监督预训练提供上下文知识先验对异常移动流量表格数据模型进行训练,获取训练好的异常移动流量表格数据模型;将测试集输入训练好的异常移动流量表格数据模型中,得到移动广告点击流量中的虚假点击流量数据。本发明能有效检测出虚假无效点击流量数据,避免无效流量造成的损失,可以在异常数据处理领域中应用。
-
公开(公告)号:CN114090654A
公开(公告)日:2022-02-25
申请号:CN202111373215.4
申请日:2021-11-19
Applicant: 北京信息科技大学
IPC: G06F16/2458 , G06F16/2455 , G06F16/2453
Abstract: 本发明涉及一种工业时序数据的近似查询处理方法、系统、介质及设备,其包括:将时序数据进行初次压缩,得到满足初始压缩精度的压缩数据;计算所述压缩数据的标准差,根据所述标准差得到压缩精度浮动;根据所述压缩精度浮动调整压缩精度,利用调整好的所述压缩精度重新进行数据压缩,直到压缩精度浮动满足预先设定条件,输出压缩后的数据;将所述压缩后的数据进行近似查询,若查询的压缩点位处于压缩点损失区间内,则对损失点位的数值进行近似估计后再进行近似查询;反之,则直接对压缩后剩余的点位进行存在性查询,得到精确的点位数值。本发明能够在海量的工业时序数据的持续产出的情况下,高效压缩时序数据并且保留数据趋势进行存储的情况。
-
公开(公告)号:CN113297252A
公开(公告)日:2021-08-24
申请号:CN202110607154.7
申请日:2021-05-28
Applicant: 北京信息科技大学
IPC: G06F16/242 , G06F16/2452 , G06F16/182 , G06F16/22 , G06F16/248 , G06F16/28 , G06F16/36 , G06F16/38 , G06F16/80 , G06F16/955
Abstract: 本发明涉及一种模式无感知的数据查询服务方法,其包括数据采集:采集待共享的工业数据集;对采集到的待共享的工业数据集进行预处理;将预处理后的待共享的工业数据集进行数据集成;利用集成好的数据构建模式无感知的数据查询服务。本发明针对大型工业数据集的数据查询服务,能实现企业在模式无感知的状态下使用数据查询服务,提升企业基于数据驱动的智能决策能力。本发明可广泛在数据处理技术领域中应用。
-
-
-
-
-
-
-