-
公开(公告)号:CN117827512A
公开(公告)日:2024-04-05
申请号:CN202311814864.2
申请日:2023-12-27
Applicant: 哈尔滨工业大学
Inventor: 胡智超 , 余翔湛 , 刘立坤 , 史建焘 , 葛蒙蒙 , 苗钧重 , 郭明昊 , 陈东鑫 , 高展鹏 , 郭一澄 , 王钲皓 , 程明明 , 张森 , 李岱林 , 张垚 , 张靖宇 , 傅言晨 , 周杰 , 牟铎
IPC: G06F11/07
Abstract: 本发明公开了一种快速可溯源的多维异常事件根因分析算法,属于数据分析技术领域。解决了现有技术中传统的异常根因分析算法准确率低且兼容性差的问题;本发明通过异常检测筛选出与异常相关的事件,对与异常相关的事件进行初始化并整合为异常相关事件集合;对异常相关事件集合进行聚合约束,根据事件的聚合约束以及关联关系建立了完整的事件聚合图作为统一的事件描述框架;在完整的事件聚合图上搜索定位根因异常事件,通过异常传播与溯源、搜索根因候选节点和根因剪枝,得到最终的根因异常集合。本发明有效地提高了多维异常事件根因分析算法的准确率和兼容性,适用于基础指标和派生指标,可以应用于多维异常事件的快速可溯源根因分析。
-
公开(公告)号:CN117806865A
公开(公告)日:2024-04-02
申请号:CN202311814861.9
申请日:2023-12-27
Applicant: 哈尔滨工业大学
Inventor: 胡智超 , 余翔湛 , 刘立坤 , 史建焘 , 葛蒙蒙 , 苗钧重 , 郭明昊 , 高展鹏 , 陈东鑫 , 王钲皓 , 郭一澄 , 张森 , 程明明 , 张垚 , 李岱林 , 傅言晨 , 张靖宇 , 牟铎 , 周杰
IPC: G06F11/07 , G06F18/2413 , G06F18/2415
Abstract: 本发明公开了一种基于K近邻高斯混合模型的在线异常检测算法,属于在线异常检测技术领域。解决了现有技术中传统的流式数据在线异常检测算法存在的依赖训练数据以及不易区分异常数据和分布偏移的问题;本发明在高斯混合模型的基础上采用了K近邻的方法进行优化,将数据点的更新范围限制在局部,设计了动态维护高斯成分的机制,根据新增数据的K近邻和高斯成分的生命周期,动态的新增和删除高斯成分,有效的支持了异常点的检测和分布偏移的自适应,异常检测通过搜索查找到多个高斯成分构成最优决策集对上下文观测数据完成异常评价。本发明有效降低了异常点对全局的影响,消除了对全量样本数据的依赖,可以应用于流式数据在线异常检测。
-
公开(公告)号:CN116743473B
公开(公告)日:2024-02-06
申请号:CN202310783622.5
申请日:2023-06-29
Applicant: 哈尔滨工业大学
Inventor: 余翔湛 , 刘立坤 , 王久金 , 史建焘 , 胡智超 , 葛蒙蒙 , 羿天阳 , 龚家兴 , 李竑杰 , 刘奉哲 , 孔德文 , 程明明 , 郭一澄 , 张森 , 高展鹏 , 王钲皓
IPC: H04L9/40
Abstract: 本发明提出一种基于并行度量学习的入侵检测方法,属于入侵检测技术领域。一种基于并行度量学习的入侵检测方法由嵌入模块、度量模块和分类器组成模型;嵌入模块用于接收五元组数据,度量模块用于获得预测相似度,分类器用于获取预测类别;具体实现过程:S1.训练模型;S2.将网络流量输入模型中,模型输出识别结果,若网络流量为非入侵流量,输出结果为0,否则,输出结果为1。解决现有技术中模型的识别效率低实时性差的技术问题;本发明只需利用嵌入模块对网络流量进行特征提取,再将所提取的特征输入分类器中,即可获得最终的识别结果,无需再和支持集中的样本一一比较,可大幅提升识别效率和识别准确率。
-
公开(公告)号:CN116776248A
公开(公告)日:2023-09-19
申请号:CN202310746661.8
申请日:2023-06-21
Applicant: 哈尔滨工业大学
Inventor: 胡智超 , 余翔湛 , 冯帅 , 刘立坤 , 史建焘 , 葛蒙蒙 , 孔德文 , 羿天阳 , 龚家兴 , 李竑杰 , 刘奉哲 , 王钲皓 , 郭一澄 , 张森 , 程明明 , 高展鹏
IPC: G06F18/2415 , G06F18/213 , G06F18/214
Abstract: 本发明提出一种基于虚拟对数的分布外检测方法,属于分布外检测技术领域。包括:S1.对流量进行特征提取,作为样本特征;S2.将样本特征输入到分类模型中,输出模型原始输出;S3.对样本特征进行特征分解;S4.令虚拟对数等于样本特征在主空间上的特征残差,加入到模型原始输出;S5.结合模型原始输出计算softmax函数值,将输入的多维向量的每一维映射到(0,1)区间的值,值的累积和为1;将虚拟对数所在维度对应的函数值,作为样本的分布外得分;S6.设置分布外阈值,判断输入样本是否为分布外样本。解决依赖单一输入源,检测精确度不高的问题。兼顾样本原始特征又利用深度学习模型学习到的知识,不需要重新训练模型。
-
公开(公告)号:CN114862001B
公开(公告)日:2023-06-02
申请号:CN202210454436.2
申请日:2022-04-27
Applicant: 哈尔滨工业大学
Abstract: 一种基于区域功能增强特征的城市人群流量预测方法及系统,涉及城市智能计算技术领域,用以解决现有技术对于城市人群流量预测准确性不高的问题。本发明的技术要点包括:根据人群移动轨迹数据和城市兴趣点位置数据提取时空轨迹特征集和区域功能增强特征集,并将时空轨迹特征集和区域功能增强特征集结合输入预训练的机器学习预测模型中预测人群流量,其中,区域功能增强特征集包括基于兴趣点的区域功能增强特征集和基于轨迹的区域功能增强特征集。本发明中模型输入特征不仅考虑了轨迹特征,还考虑了兴趣点特征,即包含了基于城市各个区域功能影响的特征提取,可以有效地提高城市动态时空轨迹的流量预测结果的准确性。
-
公开(公告)号:CN112084451B
公开(公告)日:2022-09-30
申请号:CN202010972271.9
申请日:2020-09-16
Applicant: 哈尔滨工业大学
IPC: G06F16/958 , G06F40/14 , G06V30/412 , G06V30/414
Abstract: 本发明是一种基于视觉分块的网页LOGO提取系统及方法,属于计算机网络领域,尤其涉及网页LOGO提取及视觉识别分析技术,目的是为解决网页视觉识别分析不稳定,准确率不高,实际应用效果不好等问题;本发明包括页面数据提取模块、分隔符探测模块和页面布局重构模块各模块之间呈递进逻辑连接,通过页面数据提取模块用于所需特征量的提取;分隔符探测模块负责分隔符的添加以及规则化分割;页面布局重构模块用于将页面内容重新布局重构,使得网页视觉识别率得到提高,该方法提取更为健壮的视觉特征,有更好的鲁棒性,同时具有更高的准确度。
-
公开(公告)号:CN114896423A
公开(公告)日:2022-08-12
申请号:CN202210686880.7
申请日:2022-06-17
Applicant: 哈尔滨工业大学
IPC: G06F16/36 , G06F40/295 , G06N7/00 , G06Q10/10
Abstract: 本发明提供了一种企业基本信息知识图谱的构建方法及系统。所述构建方法包括:首先,对于包含公司基本信息的网站进行数据爬虫,采集完成知识图谱所需的相关数据;其次,对构建完成的数据集进行知识抽取:实体抽取、关系抽取、属性抽取,从复杂的数据集中明确研究对象;然后,对得到的实体、关系、属性集合进行知识融合,完成实体‑关系‑实体或者实体‑属性‑属性值的三元组建立,完成知识图谱的构建过程,并利用构建完成的知识图谱与马尔可夫逻辑网结构学习结合完成知识推理。本发明搭建了一个小型知识图谱,不仅制作了一个包含企业信息的“百科知识库”,并且可进一步利用谓词表示及马尔可夫逻辑网对缺失信息的企业的各方面信息进行准确预测。
-
公开(公告)号:CN114679606A
公开(公告)日:2022-06-28
申请号:CN202210354186.5
申请日:2022-04-02
Applicant: 哈尔滨工业大学
Inventor: 余翔湛 , 刘立坤 , 史建焘 , 李精卫 , 葛蒙蒙 , 张晓慧 , 苗钧重 , 刘凡 , 韦贤葵 , 石开宇 , 王久金 , 冯帅 , 赵跃 , 宋赟祖 , 郭明昊 , 车佳臻
IPC: H04N21/234 , H04N21/44 , G06K9/62
Abstract: 本发明提出一种基于Burst特征的视频流量识别方法、系统、电子设备及存储介质,属于日志异常检测技术领域。包括以下步骤:步骤一、捕获视频流量,对视频流量进行预处理;步骤二、获取经过预处理视频流量的Burst特征和Burst序列对应的时序特征;步骤三、将Burst特征和时序特征提取后的数据作为单个视频的指纹,对数据进行分类从而识别视频流量。本发明主要针对于基于DASH协议构建的视频平台传输的视频流进行视频识别,通过每个视频独有的Burst特征进行二次特征提取,分析Brst序列中的时序特征。并创建LightGBM模型对单个视频的时序特征进行识别。解决了无法细粒度的对视频流量进行识别的技术问题。
-
公开(公告)号:CN113065419B
公开(公告)日:2022-05-24
申请号:CN202110291361.6
申请日:2021-03-18
Applicant: 哈尔滨工业大学
IPC: G06V30/41 , G06V30/418 , G06V30/146 , G06V30/19 , G06V10/75 , G06K9/62
Abstract: 本发明提出了一种基于流量高频内容的模式匹配算法及系统,涉及一种模式匹配算法,尤其涉及一种基于流量高频内容的模式匹配算法及系统。通过建立高频内容集和映射集的自动机,将当前扫描字符通过映射集与高频内容集进行匹配;映射集由高频内容集合中所有字符串的第一个字符去重后构成的集合。当访问自动机节点时,执行快速搜索以确定是否需要对高频内容集进行二次搜索。自动机扫描的过程从左往右扫描,自动机从根节点开始,扫描一个字符时匹配高频内容集的字符串,当扫描字符与高频内容集的字符串匹配时跳过高频内容,因此解决了现有技术中因忽略了流量中重复内容的特征导致的匹配效率低的问题,从而提升匹配效率。
-
公开(公告)号:CN113065419A
公开(公告)日:2021-07-02
申请号:CN202110291361.6
申请日:2021-03-18
Applicant: 哈尔滨工业大学
Abstract: 本发明提出了一种基于流量高频内容的模式匹配算法及系统,涉及一种模式匹配算法,尤其涉及一种基于流量高频内容的模式匹配算法及系统。通过建立高频内容集和映射集的自动机,将当前扫描字符通过映射集与高频内容集进行匹配;映射集由高频内容集合中所有字符串的第一个字符去重后构成的集合。当访问自动机节点时,执行快速搜索以确定是否需要对高频内容集进行二次搜索。自动机扫描的过程从左往右扫描,自动机从根节点开始,扫描一个字符时匹配高频内容集的字符串,当扫描字符与高频内容集的字符串匹配时跳过高频内容,因此解决了现有技术中因忽略了流量中重复内容的特征导致的匹配效率低的问题,从而提升匹配效率。
-
-
-
-
-
-
-
-
-