-
公开(公告)号:CN115146056A
公开(公告)日:2022-10-04
申请号:CN202210542929.1
申请日:2022-05-18
Applicant: 哈尔滨工业大学(威海)
IPC: G06F16/35 , G06F40/289 , G06F40/242 , G06N3/04 , G06N3/08
Abstract: 本发明提供一种基于网页文本内容检测色情赌博域名的方法,首先对域名发起HTTP请求,获取域名对应的HTTP文本内容,针对网页内容进行预处理,同时,构建色情、赌博、非色情赌博的三种语料库信息。针对语料库信息,进行分词处理,停用词处理等,构建算法模型的数据集信息。其次,使用语料库中的热点词汇对数据集进行编码处理,使用基于LSTM深度学习算法模型对数据编码进行处理,最后使用SoftMax三分类(色情、赌博、非色情赌博),输出结果。不仅可以解决传统黑名单检测方法中色情赌博域名频繁变更域名,不断扩充黑名单的问题,也能解决传统机器学习算法(SVM、随机森林等)人工提取文本特征的不充分,算法识别精度低等问题。
-
公开(公告)号:CN114943325A
公开(公告)日:2022-08-26
申请号:CN202210655056.5
申请日:2022-06-10
Applicant: 哈尔滨工业大学(威海)
IPC: G06N3/04 , G06N3/08 , G06K9/62 , G06F16/9536
Abstract: 本发明公开了一种基于多跳信息的图卷积聚类网络设计方法,包括:自编码器模块、多跳信息模块以及多重自监督模块。本发明可用于社交网络、舆情事件等领域的潜在群体发现,对参与用户实现聚类分析。采用上述方案,解决了现有聚类方案等同看待不同特征重要性和忽视社群中远距离邻居对用户结点影响的问题,通过对不同特征的提取,能够更加全面地考量用户之间的群体关系,提升聚类的准确度;通过对不同的特征分配不同的权重系数,能够让主要的特征在聚类中发挥重要作用,避免了过度放大辅助特征的作用。通过多重自监督模块的设计,能够将自编码器模块和多跳信息模块统一在一个框架里,更好地指导模型的训练与更新。
-
公开(公告)号:CN114821040A
公开(公告)日:2022-07-29
申请号:CN202210416878.8
申请日:2022-04-20
Applicant: 哈尔滨工业大学(威海)
IPC: G06V10/25 , G06V10/774 , G06V10/82 , G06K9/62 , G06N3/08 , G06T7/11 , G06T7/70 , G06V40/10 , G06T7/90
Abstract: 本发明提供一种基于轻量级网络模型的指静脉识别方法,针对不同的指静脉数据库采用不同的ROI区域提取方法,其采用的是轻量级指静脉识别网络模型,该轻量级指静脉识别网络模型裁剪了预训练的MobileNetV2的前七个瓶颈层,其后接着的是一个Dropout层(Dropout1)、一个卷积层(Conv)、一个归一化层(BNorm)、一个ELU层(ELU)、一个Dropout层(Dropout2)和一个全连接层(FC),以指静脉ROI图像为训练样本,采用端到端的方式对网络进行训练,对预训练MobileNetV2模型的部分结构进行微调,对辅助层进行从头训练。该方法简化了手指静脉识别流程,图片预处理过程仅需要对采集到的样本进行ROI(感兴趣区)提取;模型参数量少,降低计算机计算代价,从而提升识别速度以及减少训练成本更加节能环保。
-
公开(公告)号:CN113630409A
公开(公告)日:2021-11-09
申请号:CN202110895580.5
申请日:2021-08-05
Applicant: 哈尔滨工业大学(威海)
Abstract: 本发明提供一种基于DNS解析流量和IP流量融合分析的异常流量识别方法,该方法包括以下步骤:步骤1、工控网络通信设备资产发现,采集企业参与通信的设备列表,建立工控网络通信设备资产信息库;骤2、DNS流量特征提取;步骤3、IP流量特征提取;步骤4、异常通信行为识别;步骤5、异常流量识别与防护;步骤6、异常流量画像信息获取;步骤7、异常流量识别日志、异常流量特征组以及异常流量画像信息存储与提交。该方法结合网络的特征,获取异常流量的画像信息,建立域名、IP地址、授权行为列表以及画像信息等多层防护屏障,可以实现高精确度监测,可以为安全管理人员提供更多的决策依据。
-
公开(公告)号:CN113114797A
公开(公告)日:2021-07-13
申请号:CN202110417852.0
申请日:2021-04-19
Applicant: 哈尔滨工业大学(威海)
IPC: H04L29/12
Abstract: 本发明提供一种获取开放递归域名服务器域名解析规律的方法,具体为:获取开放递归域名服务器的IP地址以及域名的数据,对数据进行预处理,在测量主机上组建DNS查询报文,并向开放递归域名服务器发送,在测量主机上接收开放递归域名服务器返回的DNS响应报文,并进行存储,检测开放递归域名服务器的域名选择性解析规律,总结域名选择性解析规律,并输出结果。其解决了现有开放递归域名服务器选择性解析特定种类的域名,降低了为用户提供的服务质量、增加了用户的消极体验的技术问题。本发明可广泛应用于开放递归域名服务器服务质量的测评中。
-
公开(公告)号:CN119919615A
公开(公告)日:2025-05-02
申请号:CN202510203467.4
申请日:2025-02-24
Applicant: 哈尔滨工业大学(威海)
Abstract: 本公开的实施例提供了一种基于CP分解和神经网络的点云数据补全方法及装置;应用于图像视觉处理领域。方法包括将待补全点云数据中的点映射到体素网格中,获取体素网格的张量数据;对所述张量数据进行预处理,将预处理后的张量数据输入训练好的神经网络模型,以便神经网络模型对预处理后的张量数据进行cp分解,生成因子矩阵并根据生成的因子矩阵对缺失的张量数据进行cp反分解,输出重建张量数据;将重建张量数据映射至三维空间,获取补全后的点云数据。以此方式,提升了数据完整性与补全精度,减小了计算资源,有效解决了现有点云补全方法的局限性。
-
公开(公告)号:CN114970521B
公开(公告)日:2024-09-20
申请号:CN202210542962.4
申请日:2022-05-18
Applicant: 哈尔滨工业大学(威海)
IPC: G06F40/289 , G06F40/216 , G06F40/126 , G06N3/0442 , H04L61/4511
Abstract: 本发明提供一种基于域名信息检测DGA域名的方法,包括以下步骤:步骤1构建域名的字符字典和单词字典;步骤2得到域名的字符编码,词汇编码,特征编码;步骤3将字符编码、词汇编码、特征编码作为深度学习算法模型的输入,经过词嵌入,LSTM序列模型,Relu层,Dropout层,SoftMax层的多种操作后,输出深度学习算法模型的三种分类,根据输出的结果判断域名属于哪种类别。此方法不仅可以进一步提高针对基于算术和哈希算法生成的DGA域名的检测精度,也能解决针对基于词典生成的DGA域名的检测精度低,识别误差大等问题。
-
公开(公告)号:CN113630409B
公开(公告)日:2023-04-28
申请号:CN202110895580.5
申请日:2021-08-05
Applicant: 哈尔滨工业大学(威海)
IPC: H04L9/40 , H04L61/10 , H04L61/4511
Abstract: 本发明提供一种基于DNS解析流量和IP流量融合分析的异常流量识别方法,该方法包括以下步骤:步骤1、工控网络通信设备资产发现,采集企业参与通信的设备列表,建立工控网络通信设备资产信息库;骤2、DNS流量特征提取;步骤3、IP流量特征提取;步骤4、异常通信行为识别;步骤5、异常流量识别与防护;步骤6、异常流量画像信息获取;步骤7、异常流量识别日志、异常流量特征组以及异常流量画像信息存储与提交。该方法结合网络的特征,获取异常流量的画像信息,建立域名、IP地址、授权行为列表以及画像信息等多层防护屏障,可以实现高精确度监测,可以为安全管理人员提供更多的决策依据。
-
公开(公告)号:CN112883072B
公开(公告)日:2022-11-25
申请号:CN202110258091.9
申请日:2021-03-10
Applicant: 哈尔滨工业大学(威海)
IPC: G06F16/2457 , G06F16/26 , G06Q50/26 , H04L61/4511
Abstract: 本发明提供一种基于网络服务商国别标注的域名国家可控性评估方法,具体步骤为:(1)首先,分别获取域名注册商信息、CNAME信息、NS信息、IP信息、顶级域五种国别源信息;(2)其次,将所有源解析为标准的国别信息;(3)最后,根据获取国别信息的来源及重要程度,对五个标准国别信息进行加权赋值,标注域名的国别信息归属度,进行国家可控性评估。其解决了现有技术中对域名国别信息归属标注的方法较少,且不够完善,不够系统的技术问题。本发明可广泛应用于域名数据的分析中。
-
公开(公告)号:CN114970521A
公开(公告)日:2022-08-30
申请号:CN202210542962.4
申请日:2022-05-18
Applicant: 哈尔滨工业大学(威海)
IPC: G06F40/289 , G06F40/216 , G06F40/126 , G06N3/04 , H04L61/4511
Abstract: 本发明提供一种基于域名信息检测DGA域名的方法,包括以下步骤:步骤1构建域名的字符字典和单词字典;步骤2得到域名的字符编码,词汇编码,特征编码;步骤3将字符编码、词汇编码、特征编码作为深度学习算法模型的输入,经过词嵌入,LSTM序列模型,Relu层,Dropout层,SoftMax层的多种操作后,输出深度学习算法模型的三种分类,根据输出的结果判断域名属于哪种类别。此方法不仅可以进一步提高针对基于算术和哈希算法生成的DGA域名的检测精度,也能解决针对基于词典生成的DGA域名的检测精度低,识别误差大等问题。
-
-
-
-
-
-
-
-
-