-
公开(公告)号:CN119071724B
公开(公告)日:2025-03-18
申请号:CN202411104740.X
申请日:2024-08-13
Applicant: 哈尔滨工业大学(威海)
IPC: H04W4/02 , G06F16/215
Abstract: 本发明提供一种IP定位技术中Wi‑Fi地理定位基准点的数据清洗方法,涉及数据处理技术领域,所述方法包括:获取基准点数据,并从基准点数据中提取Wi‑Fi点数据;根据Wi‑Fi点数据,确定搜索半径,根据搜索半径,确定候选信息点,以及候选信息点名称;计算候选信息点名称与Wi‑Fi点用户名语义的相似度;根据相似度,确定基准点数据与候选信息点的语义匹配置信度;根据Wi‑Fi点的信号强度与距离关系,确定每个候选信息点的信号强度置信度;根据语义匹配置信度和信号强度置信度,确定最终匹配的信息点数据;根据最终匹配的信息点数据,对基准点数据进行验证清洗。本发明通过高效的数据清洗,实现Wi‑Fi信息点的精准匹配,以提升数据的准确性和可靠性。
-
公开(公告)号:CN119071724A
公开(公告)日:2024-12-03
申请号:CN202411104740.X
申请日:2024-08-13
Applicant: 哈尔滨工业大学(威海)
IPC: H04W4/02 , G06F16/215
Abstract: 本发明提供一种IP定位技术中Wi‑Fi地理定位基准点的数据清洗方法,涉及数据处理技术领域,所述方法包括:获取基准点数据,并从基准点数据中提取Wi‑Fi点数据;根据Wi‑Fi点数据,确定搜索半径,根据搜索半径,确定候选信息点,以及候选信息点名称;计算候选信息点名称与Wi‑Fi点用户名语义的相似度;根据相似度,确定基准点数据与候选信息点的语义匹配置信度;根据Wi‑Fi点的信号强度与距离关系,确定每个候选信息点的信号强度置信度;根据语义匹配置信度和信号强度置信度,确定最终匹配的信息点数据;根据最终匹配的信息点数据,对基准点数据进行验证清洗。本发明通过高效的数据清洗,实现Wi‑Fi信息点的精准匹配,以提升数据的准确性和可靠性。
-
公开(公告)号:CN115277512B
公开(公告)日:2024-05-28
申请号:CN202210902390.6
申请日:2022-07-29
Applicant: 山东天合网络空间安全技术研究院有限公司 , 哈尔滨工业大学(威海)
IPC: H04L43/12 , H04L67/10 , G06F40/289 , G06F16/35 , G06F16/38 , G06N3/0455 , G06N3/098
Abstract: 本发明提供一种DHT网络不良内容文件发现和传播监测方法及系统,其解决了现有DHT网络测量主要利用主动测量的方式与节点交互,但现有方式多以单节点随机ID法采集,容易出现死节点,效率较低的技术问题,其引入活跃节点统计自优化策略,提高了DHT网络测量效率;引入重生产机制,保证数据的充分利用;引入预训练微调模型,高效、自动化地检测DHT不良文件内容;引入周期性监测策略,减少节点频繁上下线带来的误差。本发明可广泛应用于DHT网络不良内容文件发现和传播监测。
-
公开(公告)号:CN115277211B
公开(公告)日:2023-07-28
申请号:CN202210902478.8
申请日:2022-07-29
Applicant: 哈尔滨工业大学(威海)
IPC: H04L9/40 , H04L61/4511 , G06F16/35 , G06F16/955 , G06V20/62
Abstract: 本发明提供一种基于文本和图像多模态色情和赌博域名自动检测方法,其针对色情、赌博网页的识别,利用深度学习和统计学习相结合的方法来实现对网页数据进行特征抽取,使用长距离多头自注意力的视觉语言模型的方法对网页进行识别,其针对网页所显示的内容丰富且包含大量图片与超长文本的特点进行多模态信息融合,从网页文本和网页截图两个维度对网页进行特征抽取。本发明可广泛用于基于文本和图像多模态色情和赌博域名自动检测中。
-
公开(公告)号:CN113630409B
公开(公告)日:2023-04-28
申请号:CN202110895580.5
申请日:2021-08-05
Applicant: 哈尔滨工业大学(威海)
IPC: H04L9/40 , H04L61/10 , H04L61/4511
Abstract: 本发明提供一种基于DNS解析流量和IP流量融合分析的异常流量识别方法,该方法包括以下步骤:步骤1、工控网络通信设备资产发现,采集企业参与通信的设备列表,建立工控网络通信设备资产信息库;骤2、DNS流量特征提取;步骤3、IP流量特征提取;步骤4、异常通信行为识别;步骤5、异常流量识别与防护;步骤6、异常流量画像信息获取;步骤7、异常流量识别日志、异常流量特征组以及异常流量画像信息存储与提交。该方法结合网络的特征,获取异常流量的画像信息,建立域名、IP地址、授权行为列表以及画像信息等多层防护屏障,可以实现高精确度监测,可以为安全管理人员提供更多的决策依据。
-
公开(公告)号:CN115277211A
公开(公告)日:2022-11-01
申请号:CN202210902478.8
申请日:2022-07-29
Applicant: 哈尔滨工业大学(威海)
IPC: H04L9/40 , H04L61/4511 , G06F16/35 , G06F16/955 , G06V20/62
Abstract: 本发明提供一种基于文本和图像多模态色情和赌博域名自动检测方法,其针对色情、赌博网页的识别,利用深度学习和统计学习相结合的方法来实现对网页数据进行特征抽取,使用基于稀疏多头自注意力的文本图像多模态模型的方法对网页进行识别,其针对网页所显示的内容丰富且包含大量图片与超长文本的特点进行多模态信息融合,从网页文本和网页截图两个维度对网页进行特征抽取。本发明可广泛用于基于文本和图像多模态色情和赌博域名自动检测中。
-
公开(公告)号:CN111985569B
公开(公告)日:2022-10-14
申请号:CN202010851544.4
申请日:2020-08-21
Applicant: 哈尔滨工业大学(威海)
IPC: G06K9/62 , H04L61/5007
Abstract: 本发明涉及一种基于多源点聚类思想的匿名节点定位方法,其为了减少Traceroute所得到的IP路径中匿名节点对真实网络路由节点的干扰,其包括以下步骤:获取国内的ip地址、地理位置和经纬度;用ping命令对ip进行存活性探测过滤,提取出存活的ip地址;将探测出地理位置的IP存入数据库;通过k‑means算法得到的聚类中心附近部署服务器,对同一类别内的目的节点进行traceroute探测;获取时延曲线,对时延曲线进行特征提取,进行层次聚类,依据层析树的结构对traceroute所得到的IP路径进行合并,将可能是同一个匿名节点的点进行合并,并记录其上一跳与下一跳的ip地址;计算匿名节点对的上一跳,下一跳IP所构成的集合中心,使用欧式距离对经纬度进行计算,作为该匿名节点的物理位置。
-
公开(公告)号:CN106776499B
公开(公告)日:2020-11-13
申请号:CN201611129421.X
申请日:2016-12-09
Applicant: 哈尔滨工业大学
IPC: G06F40/126 , A63F9/06
Abstract: 本发明提出一种数字化汉子拼字实现方法和装置,属于数字化汉子拼字技术领域。该方法用精确到笔画的汉字组成部分的相对空间位置来表示汉字,并在显示设备上显示和拖拽汉字的组成部件;当汉字的组成部件在相对空间位置上能够拼合成一个字的时候,识别拼合出来的汉字;显示该汉字的相关信息,如读音、字义、组词、例句等。该方法能够对汉字产生精确的识别。
-
-
-
-
-
-
-