-
公开(公告)号:CN104142985B
公开(公告)日:2018-02-06
申请号:CN201410352349.1
申请日:2014-07-23
Applicant: 哈尔滨工业大学(威海)
IPC: G06F17/30
Abstract: 本发明公开了一种半自动化的垂直爬虫生成工具及方法,该半自动化的垂直爬虫生成方法包括:用户可以选择新建或采用lex‑yacc技术打开模板,对模板文件进行词法与语法分析,维护符号表,构造出语法分析树;通过寻找词法与语法分析的规律,以及对整个分析过程中数据的存储与处理,根据模板内容构造出树形模板结构;根据要抽取的内容,在树形模板结构中增加、修改或删除模板节点,节点信息中包含跳转关系、XPath表达式、数据存储方式内容;保存模板;该半自动化的垂直爬虫生成工具包括:爬虫自动生成工具模块、爬虫模块。本发明由自动生成模板内容代替人工手动配置模板,使配置模板变得更加方便快捷,可以大大节省相关人员的工作量。
-
公开(公告)号:CN104166725A
公开(公告)日:2014-11-26
申请号:CN201410422615.3
申请日:2014-08-26
Applicant: 哈尔滨工业大学(威海)
IPC: G06F17/30
CPC classification number: H04L63/1483
Abstract: 本发明实施例公开一种钓鱼网站检测方法,应用于计算机网络领域,以解决现有的检测钓鱼网站不能主动检测、误报、漏报、不及时的问题。该方法包括:建立待测网页对应的基于视觉内容的特征向量;将特征向量与预设的特征向量集合里的特征向量进行比对;根据比对结果判断待检测网页是否是钓鱼网站。本发明实施例适用于钓鱼网站检测。
-
公开(公告)号:CN115016433B
公开(公告)日:2024-06-28
申请号:CN202210615083.X
申请日:2022-06-01
Applicant: 哈尔滨工业大学(威海) , 威海天之卫网络空间安全科技有限公司
Abstract: 一种车载CAN总线流量异常检测方法及系统,其包括获取CAN总线的流量数据并进行初步预处理;将处理后的流量数据传输至若干个控制单元进行子网络学习;根据子网络学习情况识别异常流量数据,其解决了现有的异常检测方法存在的检测性能和时效性差的技术问题,且本发明有效利用了并行结构的多视界效应实现检测能力显著提升,从而达到即快速又准确的异常流量检测效果,可广泛应用于大数据处理领域。
-
公开(公告)号:CN113469804B
公开(公告)日:2024-03-12
申请号:CN202110805932.3
申请日:2021-07-16
Applicant: 哈尔滨工业大学(威海)
Abstract: 本发明涉及一种基于图神经网络的非正常关键账户发现方法、系统、设备及存储介质,包括步骤如下:(1)数据预处理:对非正常金融账户的历史交易记录依次进行数据清洗、关键数据项提取、组织内账户交易关系构建等操作;(2)非正常组织金融交易网络图构建;根据步骤(1)构建的组织内账户交易关系构建非正常组织金融交易网络图;(3)非正常组织关键账户发现;通过训练好的TRGA模型实现非正常组织关键账户发现。本发明能够取得很好的非正常关键账户发现效果。本方法可以为相关工作人员的非正常侦查工作提供辅助研判信息,提高工作效率,节省时间。随着更多非正常标记数据的发现,分类模型会得到进一步的完善,检测识别结果准确率也有增加趋势。
-
公开(公告)号:CN111881678B
公开(公告)日:2023-11-10
申请号:CN202010747924.3
申请日:2020-07-30
Applicant: 哈尔滨工业大学(威海) , 威海天之卫网络空间安全科技有限公司
IPC: G06F40/289 , G06F40/284 , G06F40/211 , G06N3/088
Abstract: 本发明涉及一种基于无监督学习的领域词发现方法,属于计算机文本信息处理技术领域,输入通用语料和领域语料便可提取出来领域词,步骤为先把通用语料和领域语料切分,获得通用候选词库和领域候选词库,两种领域词库的处理方式相同;获取了通用候选词库和领域候选词库,对领域文本进行无监督学习,将两个词库中的词频转换为对应的概率,对两个词库的未分割句子任意切分,计算每一种切分方式的标准化概率得分,统计得分靠前的句子切分组合中的词语,收集领域词汇,把领域候选词库中的通用词转移到通用候选词库中,并保存获得领域词汇。无需人工标注语料,提高了含有标点符号的实体名称识别率。
-
公开(公告)号:CN115037508B
公开(公告)日:2023-08-22
申请号:CN202210438285.1
申请日:2022-04-25
Applicant: 哈尔滨工业大学(威海) , 威海天之卫网络空间安全科技有限公司
Abstract: 一种面向工业控制系统的多步攻击建模方法及系统,其包括进行系统拓扑分析和系统漏洞处理以生成攻击图;根据各物理组件设备的功能依赖关系构建与或图;根据攻击图和与或图生成与或攻击图;对与或攻击图进行扩展,其解决了现有的攻击建模方法存在着复杂性较高的技术问题,且本发明使得安全分析人员从全局掌握攻击者行为及其意图,充分了解工控系统当前所面临的威胁情况,可广泛应用于大数据处理领域。
-
公开(公告)号:CN116582330A
公开(公告)日:2023-08-11
申请号:CN202310579947.1
申请日:2023-05-19
Applicant: 哈尔滨工业大学(威海) , 威海天之卫网络空间安全科技有限公司
Abstract: 本申请属于工控网络安全技术领域,具体为一种面向部分未知安全状态的工控网络自动防御决策方法,包括生成攻击图步骤、动态攻击图状态估计步骤和动态防御决策步骤。本申请可以实现攻击图与真实环境的联动;解决了攻击者攻击存在隐蔽性导致的监测节点存在部分未知安全状态,可以估计节点状态;使用DQN算法,并且定义了基于工控网络的动作和奖励值,可以进行自动防御决策;实用范围为对工控系统适用场景下,面对部分设备未知安全状态的工控网络进行自动防御决策,为工控系统的安全提供技术保障,应用前景十分广泛。
-
公开(公告)号:CN111652233B
公开(公告)日:2023-04-25
申请号:CN202010495757.8
申请日:2020-06-03
Applicant: 哈尔滨工业大学(威海) , 威海天之卫网络空间安全科技有限公司
IPC: G06V20/62 , G06V10/26 , G06V10/82 , G06V10/30 , G06N3/045 , G06N3/0475 , G06N3/044 , G06N3/048 , G06N3/082
Abstract: 本发明涉及一种针对复杂背景的文本验证码自动识别方法,包括:验证码去噪模块通过循环生成式对抗网络去除真实验证码的复杂安全特征;字符分割模块使用图像处理算法将整体验证码图片分割为单个字符;分割后的字符送入文本识别网络得到最终输出。本发明提出的文本验证码自动识别方法可以快速有效的识别带有背景噪声、字符扭曲、边缘模糊的文本类型验证码,具有高度泛化性和可移植性,可以简单的嵌入到爬虫算法中,解决数据获取过程中遇到的验证码问题。
-
公开(公告)号:CN110399718B
公开(公告)日:2023-01-20
申请号:CN201910482385.2
申请日:2019-06-04
Applicant: 哈尔滨工业大学(威海) , 哈工大(威海)创新创业园有限责任公司
Abstract: 本发明公开了一种针对工业控制系统的远程渗透取证的方法,包括如下步骤:(1)本地提权;(2)权限驻留;(3)信息收集;(4)本地漏洞扫描;(5)远程扫描利用,本发明所公开的方法可以在目标工控内网中,以渗透人员的视角,对目标网络和目标主机进行内网渗透测试,为工控安全防护提供了参考价值并为工控安全评估提供了专业性工具,对工控安全评估、取证和防护具有重要意义。
-
公开(公告)号:CN115442107A
公开(公告)日:2022-12-06
申请号:CN202211054379.5
申请日:2022-08-31
Applicant: 哈尔滨工业大学(威海) , 威海天之卫网络空间安全科技有限公司
Abstract: 本申请提供了一种基于高斯混合模型的通信数据异常检测方法,解决了现有的基于统计方法的异常检测预测效果不理想、计算复杂度高的技术问题。其包括以下步骤:输入数据集:输入网络通信行为数据集,数据集为若干条通信在各个阶段的时间成本集合;确定隐变量:每个阶段的数据均来自高斯混合模型,设定隐变量为链路编号Z,且取值范围为[1,K];构成每个高斯混合模型的高斯分布的数量等于链路条数K;参数求解:通过EM算法,进行迭代求解,对该隐变量确定的高斯混合模型进行参数求解;异常检测:新通信行为出现时,通过计算该通信行为的数据点来自高斯混合模型的概率,来预测是否存在异常攻击。本申请广泛应用于通信数据异常检测技术领域。
-
-
-
-
-
-
-
-
-