-
公开(公告)号:CN110362678A
公开(公告)日:2019-10-22
申请号:CN201910481863.8
申请日:2019-06-04
Applicant: 哈尔滨工业大学(威海) , 哈工大(威海)创新创业园有限责任公司
Abstract: 本发明公开了一种自动提取中文文本关键词的方法与装置,该方法包括:首先对文本进行中文分词和去除停用词;然后将单词转化为词向量,然后统计词频,通过词频和词语相似度计算单词在文本中的权重;然后构建基于图模型的文本排序算法,多次迭代计算出顶点得分;并且每次迭代计算过程中对关键词合并,并在图模型中添加新顶点并计算得分,然后对顶点得分进行排序,得分最大的为文本中最重要的关键词,本发明可实现中文文本关键词的准确提取。
-
公开(公告)号:CN110351251A
公开(公告)日:2019-10-18
申请号:CN201910534090.5
申请日:2019-06-20
Applicant: 哈尔滨工业大学(威海) , 威海天之卫网络空间安全科技有限公司
IPC: H04L29/06 , G06F16/9035
Abstract: 本发明属于电通讯技术领域,涉及一种工控设备资产探测方法。一种基于过滤技术的工控设备资产探测方法,包括:首先使用Shodan过滤出目标网段中未被识别为工控设备的IP;对所述IP使用主动探测进行扫描,将主动探测的结果存入数据库,此时数据库中就是所需要的探测结果。本发明提出的基于过滤技术的工控资产设备探测方法,能够对目标网段中的工控设备进行较为全面的探测,为资产探测过程提供了新思路。
-
公开(公告)号:CN109189519A
公开(公告)日:2019-01-11
申请号:CN201810837024.0
申请日:2018-07-26
Applicant: 哈尔滨工业大学(威海)
Abstract: 本发明提供通用的用户桌面行为模拟系统及方法,通过采集和分析用户行为,挖掘用户行为中蕴含的软件操作知识,构建用户行为的表述模型,从而实现智能自动化的桌面行为脚本生成,提供软件自动化使用和模拟指定真实用户桌面行为的功能。针对网络靶场和测试床中对逼真用户行为模拟和桌面环境下执行自动化软件操作、智能脚本生成的需求,提供了一种通用的用户桌面行为模拟系统及方法。该系统能够精确采集所需行为数据,既可以高度复现用户的历史行为,又可以挖掘用户行为蕴含的软件操作知识,从而实现自动化操作、脚本生成和用户桌面行为模拟。
-
公开(公告)号:CN109120737A
公开(公告)日:2019-01-01
申请号:CN201810908823.2
申请日:2018-08-10
Applicant: 哈尔滨工业大学(威海)
Abstract: 本发明提供一种基于泊松模型的递增型对称NAT的UDP穿透方法与系统,考虑对称型NAT的两种类型、NAT分配端口的全局性特征、NAT对于释放端口的处理、以及NAT端口分配触底处理这四个重要因素,采用时齐泊松过程模拟内网访问外网的随机过程,从而预测出时间T内可能的内网访问外网数,实现递增型对称NAT的穿透,进而实现真正意义上的P2P通信网络。采用泊松模型模拟网络工作量,预测出NAT分配的下一个端口范围,进而实现递增型对称NAT的穿透。递增型对称NAT穿透前的数据采集、分析与训练;递增型对称NAT所处网络工作量的模拟;对地址敏感的递增型对称NAT的穿透;对端口敏感的递增型对称NAT的穿透。
-
公开(公告)号:CN109040081A
公开(公告)日:2018-12-18
申请号:CN201810908816.2
申请日:2018-08-10
Applicant: 哈尔滨工业大学(威海)
Abstract: 本发明提供一种基于BWT的协议字段逆向分析系统及方法,构建了特定的后缀索引,从而使特定的子字符串匹配在每次比对过程中只需要完整一次,并且基于后缀索引的比对算法设计灵活性大,索引阶段空间消耗较少,子序列长度或可变,能够快速识别协议字段。本发明在识别固定字段后,通过随机多流多段匹配的方法,统计高频率出现的字段,并依据字段位置和字段数量构建文法树,提取字段结构,从而实现字段格式的逆向。本发明对于逆向的字段进行分类后,作为模糊测试工具的输入,向目标通信实体发送大量畸形测试用例,同时结合调试器和嗅探器对目标通信实体进行异常监控,发现异常并分析异常,以便后续提高目标通信实体的安全性。
-
公开(公告)号:CN108959425A
公开(公告)日:2018-12-07
申请号:CN201810592946.X
申请日:2018-06-11
Applicant: 哈尔滨工业大学(威海)
IPC: G06F17/30
Abstract: 本发明提供一种海量数据Top‑k选择查询方法,有效地处理大数据上的top‑k选择查询,提出了基于表扫描的TKS算法,该算法通过对预排序表PT的顺序扫描来计算top‑k选择查询结果。本发明具有早结束特性;在连续扫描预排序表的过程中,只需要维护k个候选结果;并且选择剪切和分数剪切可以有效的减少I/O的代价,选择剪切是利用位图编码去掉不满足选择条件的元组,而分数剪切是利用评分函数的单调性和预排序列表的有序性跳过那些不满足分数要求的元组。
-
公开(公告)号:CN107908300A
公开(公告)日:2018-04-13
申请号:CN201711148377.1
申请日:2017-11-17
Applicant: 哈尔滨工业大学(威海)
IPC: G06F3/0354 , G06F9/455 , G06F17/30
Abstract: 本发明涉及一种用户鼠标行为的合成与模拟方法及系统,包括:(1)数据采集与处理:实时采集用户的原始鼠标数据,分割、清洗后,存入历史操作数据库;(2)模型训练:对于无需移动的操作,训练截尾正态分布模型,生成时间间隔参数;对于需要移动的操作,提取聚类特征和匹配特征,构建训练集;(3)操作合成与模拟:对于无需移动的操作,使用截尾正态分布模型构造模拟操作的消息序列;对于需要移动的操作,使用聚类模型和分类模型,匹配出一个样本作为模板;合成出符合待模拟操作的要求参数的合成操作序列。本发明以超过70%的成功率通过现有技术文献实现的基于该操作构建的身份认证模型。
-
公开(公告)号:CN107808000A
公开(公告)日:2018-03-16
申请号:CN201711115185.0
申请日:2017-11-13
Applicant: 哈尔滨工业大学(威海) , 威海天之卫网络空间安全科技有限公司
IPC: G06F17/30
Abstract: 本发明涉及一种暗网数据采集与抽取系统及方法,包括依次连接的暗网站点发现模块、暗网数据爬取模块、页面解析与内容抽取模块、数据融合与存储模块;暗网站点发现模块获取多源数据中的暗网url;暗网数据爬取模块配置Tor服务,修改Nutch的配置,使其与socks协议交互,进行数据的爬取;页面解析与内容抽取模块进行页面解析、页面向量化、特征码生成、相似度计算与模板集更新、页面内容抽取;数据融合与存储模块采用数据对齐策略对抽取得到的内容重组,将内容相近的数据记录融合存入数据库中。本发明实现了完整的页面保存到内容抽取的系统设计流程,为暗网中违法交易活动的发现与暗网知识图谱的建立提供数据支撑。
-
公开(公告)号:CN107786554A
公开(公告)日:2018-03-09
申请号:CN201710997699.7
申请日:2017-10-24
Applicant: 哈尔滨工业大学(威海) , 威海天之卫网络空间安全科技有限公司
Abstract: 本发明涉及一种自动检测IPsec协议中间人攻击的方法与装置,包括步骤如下:(1)在IPsec建立安全隧道时,在客户端或服务器端获取各数据报的发送、返回时间;(2)计算相邻两个数据报之间的时间间隔;(3)计算相邻两个数据报之间的时间间隔的方差;(4)比较方差与设置阈值的大小,如果方差大于设置阈值,则发出中间人攻击警报,提醒工作人员进行处理;否则,则认为是正常连接;本发明提出的自动检测IPsec中间人攻击的方法和装置,可以在IKE协商阶段就对IPsec流量是否遭受中间人攻击进行识别,以便工作人员尽早发现,及时处理。
-
公开(公告)号:CN104166725B
公开(公告)日:2018-01-12
申请号:CN201410422615.3
申请日:2014-08-26
Applicant: 哈尔滨工业大学(威海)
IPC: G06F17/30
Abstract: 本发明实施例公开一种钓鱼网站检测方法,应用于计算机网络领域,以解决现有的检测钓鱼网站不能主动检测、误报、漏报、不及时的问题。该方法包括:建立待测网页对应的基于视觉内容的特征向量;将特征向量与预设的特征向量集合里的特征向量进行比对;根据比对结果判断待测网页是否是钓鱼网站。本发明实施例适用于钓鱼网站检测。
-
-
-
-
-
-
-
-
-