-
公开(公告)号:CN115146056A
公开(公告)日:2022-10-04
申请号:CN202210542929.1
申请日:2022-05-18
Applicant: 哈尔滨工业大学(威海)
IPC: G06F16/35 , G06F40/289 , G06F40/242 , G06N3/04 , G06N3/08
Abstract: 本发明提供一种基于网页文本内容检测色情赌博域名的方法,首先对域名发起HTTP请求,获取域名对应的HTTP文本内容,针对网页内容进行预处理,同时,构建色情、赌博、非色情赌博的三种语料库信息。针对语料库信息,进行分词处理,停用词处理等,构建算法模型的数据集信息。其次,使用语料库中的热点词汇对数据集进行编码处理,使用基于LSTM深度学习算法模型对数据编码进行处理,最后使用SoftMax三分类(色情、赌博、非色情赌博),输出结果。不仅可以解决传统黑名单检测方法中色情赌博域名频繁变更域名,不断扩充黑名单的问题,也能解决传统机器学习算法(SVM、随机森林等)人工提取文本特征的不充分,算法识别精度低等问题。
-
公开(公告)号:CN115022018A
公开(公告)日:2022-09-06
申请号:CN202210606191.0
申请日:2022-05-31
Applicant: 哈尔滨工业大学(威海)
IPC: H04L9/40 , H04L61/4511
Abstract: 本发明涉及一种基于网络实体动态调整举报治理恶意域名的方法,其解决了现有方法对恶意域名精准治理研究较少,治理方法孤立且难联动的技术问题,其包括收集各类可正常访问的恶意域名及它们的基础信息;然后根据这些信息进行网络实体的识别与网络实体基础信息的匹配与收集,并向符合条件的网络实体进行举报;在举报之后对各网络实体的治理效果进行跟踪与评估,根据评估状况不断调整与优化举报机制。本发明可广泛应于计算机领域需要及时清除或者拦截恶意域名的场合。
-
公开(公告)号:CN114880541A
公开(公告)日:2022-08-09
申请号:CN202210606165.8
申请日:2022-05-31
Applicant: 哈尔滨工业大学(威海)
IPC: G06F16/951 , G06F16/958 , G06F16/906 , G06F16/583 , G06Q10/06 , G06Q30/02 , H04L9/40 , H04L67/02
Abstract: 本发明涉及一种多设备网页中内嵌广告获取以及恶意性识别的方法,其解决了现有技术对跨平台及跨浏览器广告识别及恶意性标注方法较少,且不够完善,不够系统的技术问题,其步骤包括:从浏览器HTML文本中对资源记录进行捕捉,根据广告判定规则,使用正则表达式方式筛选出广告资源,并分别对广告资源中的图片资源和跳转链接资源进行解析;对解析结果按不同维度进行分类,具体包括:煽动特征分类过程和广告内容分类过程;对各维度分类结果,按维度重要程度进行加权赋值,标注广告的恶意性程度,进行风险评估。本发明可广泛应用于对违法违规广告的监测识别。
-
公开(公告)号:CN114821040A
公开(公告)日:2022-07-29
申请号:CN202210416878.8
申请日:2022-04-20
Applicant: 哈尔滨工业大学(威海)
IPC: G06V10/25 , G06V10/774 , G06V10/82 , G06K9/62 , G06N3/08 , G06T7/11 , G06T7/70 , G06V40/10 , G06T7/90
Abstract: 本发明提供一种基于轻量级网络模型的指静脉识别方法,针对不同的指静脉数据库采用不同的ROI区域提取方法,其采用的是轻量级指静脉识别网络模型,该轻量级指静脉识别网络模型裁剪了预训练的MobileNetV2的前七个瓶颈层,其后接着的是一个Dropout层(Dropout1)、一个卷积层(Conv)、一个归一化层(BNorm)、一个ELU层(ELU)、一个Dropout层(Dropout2)和一个全连接层(FC),以指静脉ROI图像为训练样本,采用端到端的方式对网络进行训练,对预训练MobileNetV2模型的部分结构进行微调,对辅助层进行从头训练。该方法简化了手指静脉识别流程,图片预处理过程仅需要对采集到的样本进行ROI(感兴趣区)提取;模型参数量少,降低计算机计算代价,从而提升识别速度以及减少训练成本更加节能环保。
-
公开(公告)号:CN111884813B
公开(公告)日:2022-03-25
申请号:CN202010775718.3
申请日:2020-08-05
Applicant: 哈尔滨工业大学(威海)
Abstract: 本发明涉及一种恶意证书检测方法,其解决了检测恶意证书方法出现的准确率不高,涉及恶意证书范围不广的技术问题,其包括:对证书进行基本的内容解析和规范性的检验,判断它是否符合RFC 5280;从CCADB获取的可信根证书和中间证书,结合证书本身AIA拓展信息中的CERT_ISSUER来构建完整的证书链,验证证书签名,验证整个证书链上的证书;对之前获取的证书的内容及相关的验证信息进行特征的提取;收集良性证书数据和恶意证书数据,对证书进行特征的提取;在数据特征提取之后,构建检测模型并实现对恶意证书的验证。本发明可广泛应于检测恶意的X.509证书。
-
公开(公告)号:CN113630409A
公开(公告)日:2021-11-09
申请号:CN202110895580.5
申请日:2021-08-05
Applicant: 哈尔滨工业大学(威海)
Abstract: 本发明提供一种基于DNS解析流量和IP流量融合分析的异常流量识别方法,该方法包括以下步骤:步骤1、工控网络通信设备资产发现,采集企业参与通信的设备列表,建立工控网络通信设备资产信息库;骤2、DNS流量特征提取;步骤3、IP流量特征提取;步骤4、异常通信行为识别;步骤5、异常流量识别与防护;步骤6、异常流量画像信息获取;步骤7、异常流量识别日志、异常流量特征组以及异常流量画像信息存储与提交。该方法结合网络的特征,获取异常流量的画像信息,建立域名、IP地址、授权行为列表以及画像信息等多层防护屏障,可以实现高精确度监测,可以为安全管理人员提供更多的决策依据。
-
公开(公告)号:CN113590909A
公开(公告)日:2021-11-02
申请号:CN202110856090.4
申请日:2021-07-28
Applicant: 哈尔滨工业大学(威海)
IPC: G06F16/951 , G06F16/29 , G06F16/903 , G06F16/9537 , H04L29/08 , H04L29/12
Abstract: 本发明涉及一种基于多源信息定位域名根镜像节点地理位置的方法,其解决了现有根镜像识别方法无法确定域名解析响应的镜像节点以及无法确定具体地理位置的技术问题,其包含以下步骤:获取标识符nsid信息源,其包括通过网络爬虫获取VeriSign网站提供的根镜像地理经纬度坐标信息,构造镜像标识符nsid与地理经纬度之间的映射集合setroot_lg;或者通过主动探测数据获取;根据nsid信息确定nsid对应的地理位置。本发明可广泛应用于采用任播技术提供解析服务的环境下,发现镜像任播节点并进行地理定位的领域。
-
公开(公告)号:CN113141611A
公开(公告)日:2021-07-20
申请号:CN202110583362.8
申请日:2021-05-27
Applicant: 哈尔滨工业大学(威海)
Abstract: 本发明涉及一种基于多元异常行为特征检测云手机号码账户的方法,其解决了现有国内云手机号码的使用广泛但多数平台未能采取有效检测手段的技术问题,其根据用户使用电脑或移动设备注册、登录和操作应用平台的在线账户时,会在平台的网站或app的后台产生网络特征,通过分析和提取应用平台的账户信息,从云手机号码账户自身特性以及与其关联的IP、地理位置、登陆设备维度抽象出云手机号码账户具有的异常行为特征,依据各项特征的检测有效性与检测成本比值,在用户注册、用户登陆和/或账户数据库轮询检测场景下,对云手机号码注册账户的异常行为特征进行检测。本发明可广泛应用于云手机号码账号的检测。
-
公开(公告)号:CN113114797A
公开(公告)日:2021-07-13
申请号:CN202110417852.0
申请日:2021-04-19
Applicant: 哈尔滨工业大学(威海)
IPC: H04L29/12
Abstract: 本发明提供一种获取开放递归域名服务器域名解析规律的方法,具体为:获取开放递归域名服务器的IP地址以及域名的数据,对数据进行预处理,在测量主机上组建DNS查询报文,并向开放递归域名服务器发送,在测量主机上接收开放递归域名服务器返回的DNS响应报文,并进行存储,检测开放递归域名服务器的域名选择性解析规律,总结域名选择性解析规律,并输出结果。其解决了现有开放递归域名服务器选择性解析特定种类的域名,降低了为用户提供的服务质量、增加了用户的消极体验的技术问题。本发明可广泛应用于开放递归域名服务器服务质量的测评中。
-
公开(公告)号:CN111985569A
公开(公告)日:2020-11-24
申请号:CN202010851544.4
申请日:2020-08-21
Applicant: 哈尔滨工业大学(威海)
Abstract: 本发明涉及一种基于多源点聚类思想的匿名节点定位方法,其为了减少Traceroute所得到的IP路径中匿名节点对真实网络路由节点的干扰,其包括以下步骤:获取国内的ip地址、地理位置和经纬度;用ping命令对ip进行存活性探测过滤,提取出存活的ip地址;将探测出地理位置的IP存入数据库;通过k-means算法得到的聚类中心附近部署服务器,对同一类别内的目的节点进行traceroute探测;获取时延曲线,对时延曲线进行特征提取,进行层次聚类,依据层析树的结构对traceroute所得到的IP路径进行合并,将可能是同一个匿名节点的点进行合并,并记录其上一跳与下一跳的ip地址;计算匿名节点对的上一跳,下一跳IP所构成的集合中心,使用欧式距离对经纬度进行计算,作为该匿名节点的物理位置。
-
-
-
-
-
-
-
-
-