-
公开(公告)号:CN110569286A
公开(公告)日:2019-12-13
申请号:CN201910858112.3
申请日:2019-09-11
Applicant: 哈尔滨工业大学(威海)
IPC: G06F16/2458 , G06F16/29 , G06F21/62
Abstract: 本发明涉及数据隐私保护领域,主要是研究如何在进行个人数据收集挖掘的场景下,既能保证数据满足本地差分隐私的要求,又能保证可以从数据中挖掘出活动时序轨迹的一种基于本地差分隐私的活动时序轨迹挖掘的方法,其设有采集数据的客户端和本地客户端,采集数据的客户端在本地将采用客户端算法的原始隐私数据加噪声,使之满足隐私保护预算参数为 的本地差分隐私要求,原始隐私数据会存储在本地客户端,本地客户端会从数据记录集中随机选取一对具有前后时序关系的记录,然后将其转化为时序矩阵,随后加噪处理。本发明可广泛应用于基于本地差分隐私的活动时序轨迹的挖掘。
-
公开(公告)号:CN110049052A
公开(公告)日:2019-07-23
申请号:CN201910327562.X
申请日:2019-04-23
Applicant: 哈尔滨工业大学(威海)
Abstract: 本发明提供一种基于DOM树的标签及属性相似性的恶意域名检测方法,其解决了现有恶意域名检测方法检测率低、准确性差的技术问题。该方法包括:采集恶意类型域名集,将恶意域名集转化成二进制串存入数据库;将未知类型的域名转化为二进制串;将未知类型域名对应的二进制串与数据库中恶意类型域名集的二进制串对比,通过二者相似度来判断该未知类型域名的恶意性。本发明可广泛应用于网络安全系统中。
-
公开(公告)号:CN108615199A
公开(公告)日:2018-10-02
申请号:CN201810448870.3
申请日:2018-05-11
Applicant: 国家计算机网络与信息安全管理中心 , 哈尔滨工业大学(威海)
Inventor: 严寒冰 , 张兆心 , 朱天 , 丁丽 , 李佳 , 温森浩 , 李志辉 , 姚力 , 朱芸茜 , 王小群 , 张腾 , 吕利锋 , 陈阳 , 李世淙 , 徐剑 , 王适文 , 饶毓 , 肖崇蕙 , 贾子骁 , 张帅 , 吕志泉 , 韩志辉 , 马莉雅 , 雷君 , 周彧 , 周昊 , 高川 , 楼书逸 , 文静
Abstract: 本发明提供一种基于互联网公开论坛注册情况的用户活动轨迹挖掘方法,其解决了现有方法无法追溯互联网虚拟用户身份的技术问题;包括以下步骤:步骤1,通过论坛站点拓展发现当前互联网空间中的论坛站点,即进行域名收集;步骤2,识别域名是否为中文论坛站点;步骤3,通过基于注册机制的论坛站点查重接口发现探测用户互联网论坛活动行迹。本发明广泛应用于信息技术领域。
-
公开(公告)号:CN103581363B
公开(公告)日:2017-12-12
申请号:CN201310618133.0
申请日:2013-11-29
Applicant: 哈尔滨工业大学(威海)
Abstract: 本发明涉及网络安全技术领域,具体地说是一种对恶意域名和非法访问的控制方法及装置,其特征在于所述中间件包括内核态协议栈数据包拦截模块、用户态DNS解析模块、控制策略模块、黑/白名单索引数据库模块、黑/白名单匹配模块以及日志模块,其中所述内核态协议栈数据包拦截模块位于用户态DNS解析模块的前端,控制策略模块与用户态DNS解析模块的输出相连,控制策略模块的输出端与日志模块相连接,控制策略模块与黑/白名单匹配模块相连接,黑/白名单匹配模块与黑/白名单索引数据库模块相连接,本发明与现有技术相比,从通用性、可用性、可控性、安全性、及时性和有效性等多个角度提高域名服务的安全性。
-
公开(公告)号:CN119071724B
公开(公告)日:2025-03-18
申请号:CN202411104740.X
申请日:2024-08-13
Applicant: 哈尔滨工业大学(威海)
IPC: H04W4/02 , G06F16/215
Abstract: 本发明提供一种IP定位技术中Wi‑Fi地理定位基准点的数据清洗方法,涉及数据处理技术领域,所述方法包括:获取基准点数据,并从基准点数据中提取Wi‑Fi点数据;根据Wi‑Fi点数据,确定搜索半径,根据搜索半径,确定候选信息点,以及候选信息点名称;计算候选信息点名称与Wi‑Fi点用户名语义的相似度;根据相似度,确定基准点数据与候选信息点的语义匹配置信度;根据Wi‑Fi点的信号强度与距离关系,确定每个候选信息点的信号强度置信度;根据语义匹配置信度和信号强度置信度,确定最终匹配的信息点数据;根据最终匹配的信息点数据,对基准点数据进行验证清洗。本发明通过高效的数据清洗,实现Wi‑Fi信息点的精准匹配,以提升数据的准确性和可靠性。
-
公开(公告)号:CN119449481A
公开(公告)日:2025-02-14
申请号:CN202510013317.7
申请日:2025-01-06
Applicant: 哈尔滨工业大学(威海) , 山东天合网络空间安全技术研究院有限公司
IPC: H04L9/40 , G06F16/955 , G06F16/2458 , G06F21/64
Abstract: 本发明提供一种基于多维特征融合的非法网站团伙识别方法及系统,涉及网络安全领域,所述方法包括:通过流量镜像技术或网络探针实时捕获网络流量数据,以采集被动流量数据;对采集的数据进行保存,并通过主动请求,从目标网站中提取多维特征,以实现特征提取;将提取的多维特征进行特征融合与多维分析,以得到融合特征与分析结果;根据融合特征与分析结果,对机器学习模型进行训练和优化,以得到训练好的模型;通过利用训练好的模型对新的网站数据进行非法团伙识别与关联分析,以构建非法团伙的网络拓扑结构。本发明实现了高效、精准的非法网站团伙识别,提升了网络安全监测的实时性与全面性。
-
公开(公告)号:CN119071724A
公开(公告)日:2024-12-03
申请号:CN202411104740.X
申请日:2024-08-13
Applicant: 哈尔滨工业大学(威海)
IPC: H04W4/02 , G06F16/215
Abstract: 本发明提供一种IP定位技术中Wi‑Fi地理定位基准点的数据清洗方法,涉及数据处理技术领域,所述方法包括:获取基准点数据,并从基准点数据中提取Wi‑Fi点数据;根据Wi‑Fi点数据,确定搜索半径,根据搜索半径,确定候选信息点,以及候选信息点名称;计算候选信息点名称与Wi‑Fi点用户名语义的相似度;根据相似度,确定基准点数据与候选信息点的语义匹配置信度;根据Wi‑Fi点的信号强度与距离关系,确定每个候选信息点的信号强度置信度;根据语义匹配置信度和信号强度置信度,确定最终匹配的信息点数据;根据最终匹配的信息点数据,对基准点数据进行验证清洗。本发明通过高效的数据清洗,实现Wi‑Fi信息点的精准匹配,以提升数据的准确性和可靠性。
-
公开(公告)号:CN114970521B
公开(公告)日:2024-09-20
申请号:CN202210542962.4
申请日:2022-05-18
Applicant: 哈尔滨工业大学(威海)
IPC: G06F40/289 , G06F40/216 , G06F40/126 , G06N3/0442 , H04L61/4511
Abstract: 本发明提供一种基于域名信息检测DGA域名的方法,包括以下步骤:步骤1构建域名的字符字典和单词字典;步骤2得到域名的字符编码,词汇编码,特征编码;步骤3将字符编码、词汇编码、特征编码作为深度学习算法模型的输入,经过词嵌入,LSTM序列模型,Relu层,Dropout层,SoftMax层的多种操作后,输出深度学习算法模型的三种分类,根据输出的结果判断域名属于哪种类别。此方法不仅可以进一步提高针对基于算术和哈希算法生成的DGA域名的检测精度,也能解决针对基于词典生成的DGA域名的检测精度低,识别误差大等问题。
-
公开(公告)号:CN115277512B
公开(公告)日:2024-05-28
申请号:CN202210902390.6
申请日:2022-07-29
Applicant: 山东天合网络空间安全技术研究院有限公司 , 哈尔滨工业大学(威海)
IPC: H04L43/12 , H04L67/10 , G06F40/289 , G06F16/35 , G06F16/38 , G06N3/0455 , G06N3/098
Abstract: 本发明提供一种DHT网络不良内容文件发现和传播监测方法及系统,其解决了现有DHT网络测量主要利用主动测量的方式与节点交互,但现有方式多以单节点随机ID法采集,容易出现死节点,效率较低的技术问题,其引入活跃节点统计自优化策略,提高了DHT网络测量效率;引入重生产机制,保证数据的充分利用;引入预训练微调模型,高效、自动化地检测DHT不良文件内容;引入周期性监测策略,减少节点频繁上下线带来的误差。本发明可广泛应用于DHT网络不良内容文件发现和传播监测。
-
公开(公告)号:CN115277211B
公开(公告)日:2023-07-28
申请号:CN202210902478.8
申请日:2022-07-29
Applicant: 哈尔滨工业大学(威海)
IPC: H04L9/40 , H04L61/4511 , G06F16/35 , G06F16/955 , G06V20/62
Abstract: 本发明提供一种基于文本和图像多模态色情和赌博域名自动检测方法,其针对色情、赌博网页的识别,利用深度学习和统计学习相结合的方法来实现对网页数据进行特征抽取,使用长距离多头自注意力的视觉语言模型的方法对网页进行识别,其针对网页所显示的内容丰富且包含大量图片与超长文本的特点进行多模态信息融合,从网页文本和网页截图两个维度对网页进行特征抽取。本发明可广泛用于基于文本和图像多模态色情和赌博域名自动检测中。
-
-
-
-
-
-
-
-
-