-
公开(公告)号:CN111538836B
公开(公告)日:2024-02-02
申请号:CN202010321249.8
申请日:2020-04-22
Applicant: 哈尔滨工业大学(威海) , 国家计算机网络与信息安全管理中心
IPC: G06F16/35 , G06F16/951 , G06F40/284 , G06F18/2431
Abstract: 本发明涉及一种识别文本类广告中金融广告的方法,其解决了现有广告分析模型无法有效识别金融广告的技术问题,其包括以下步骤:(1)从数据库中获取爬取到的广告文本数据;(2)对步骤(1)的文本数据进行预处理,进行分词以及去除无用信息;(3)将步骤(2)预处理后的文本通过不同的方式表示为计算机可以处理的方式,即文本表示;(4)针对步骤(3)的不同文本表示方式选择合适的分类算法,然后将文本表示的语义信息提炼成类别信息;(5)将步骤(4)中不同文本表示方式表示的分类模型进行整合,获得最终的金融广告识别模型。本发明可广泛应于在文本类广告中识别金融广告的场合。
-
公开(公告)号:CN113268247B
公开(公告)日:2024-01-23
申请号:CN202110616240.4
申请日:2021-06-02
Applicant: 哈尔滨工业大学(威海)
Abstract: 本发明提供一种基于状态机的HL7消息解析方法,具体步骤为:A.实现基于HL7消息格式的词法分析器;B.构建HL7消息解析的状态转移图;C.以词法分析器获得的词法单元作为输入,进行状态转移。其解决了现有技术中对HL7消息的解析速度较慢的技术问题。本发明可广泛应用于HL7消息解析中。
-
公开(公告)号:CN114866295B
公开(公告)日:2023-07-25
申请号:CN202210417058.0
申请日:2022-04-20
Applicant: 哈尔滨工业大学(威海)
IPC: H04L9/40 , H04L67/51 , H04L101/69
Abstract: 本发明提供一种不良站点服务IP池构建及IP主体属性数据采集和分析方法,包括以下步骤:步骤S1、构建不良信息站点服务IP池;步骤S2、监测不良信息站点服务IP池中的不良站点和IP地址;步骤S3、分析IP地址为不良站点提供服务的原因。该方法解决不良站点服务IP地址承载实体、网络空间和地理空间分布情况不清楚的问题,通过该方法可以对为不良站点提供服务的IP地址进行地理信息和服务信息等属性时空上的数据分析,推断IP地址的网络主体,进而获得IP地址为不良站点提供服务的原因分析,有效提高对不良站点监测的及时性、精确性。
-
公开(公告)号:CN114928472B
公开(公告)日:2023-07-18
申请号:CN202210416876.9
申请日:2022-04-20
Applicant: 哈尔滨工业大学(威海)
IPC: H04L9/40 , G06N3/0442 , H04L61/4511 , G06F18/22 , H04L101/69
Abstract: 本发明提供一种基于全量流通主域名的不良站点灰名单过滤方法,包括以下步骤:步骤1、构建基于字符相似性的不良站点域名的名称判别模型,实现对全量域名中疑似不良站点域名的粗过滤;步骤2、识别域名是否可解析并用于Web服务;步骤3、基于IP相似性进行粗过滤;步骤4、基于IP定位技术,进行域名的地理区域分类;步骤5、分析粗过滤得到的不良站点域名灰名单的准确度;步骤6、对粗过滤步骤1与步骤3进行迭代优化。该方法通过域名字符相似性与服务IP相似性的过滤,将已有的域名量级大范围缩减,大幅度减少因获取和解析网页文本与快照所带来的时间耗费的同时,实现对全量域名的高效准确过滤。
-
公开(公告)号:CN113489718B
公开(公告)日:2023-04-07
申请号:CN202110751479.2
申请日:2021-07-02
Applicant: 哈尔滨工业大学(威海)
Abstract: 本发明涉及一种针对DICOM协议传输流量重组生成图像的方法,其解决了现有网络中通过DICOM协议传输医疗数据,还原图像数据的技术问题,其包括以下步骤:使用DPDK对DICOM网络流量进行采集;针对数据报文进行TCP流重组;针对TCP流进行PDU解析,并生成DCM文件;解析DCM文件生成医疗图像文件。本发明可广泛应用于在网络中通过DICOM协议传输医疗数据的场合。
-
公开(公告)号:CN115277512A
公开(公告)日:2022-11-01
申请号:CN202210902390.6
申请日:2022-07-29
Applicant: 哈尔滨工业大学(威海)
Abstract: 本发明提供一种DHT网络不良内容文件发现和传播监测方法及系统,其解决了现有DHT网络测量主要利用主动测量的方式与节点交互,但现有方式多以单节点随机ID法采集,容易出现死节点,效率较低的技术问题,其引入活跃节点统计自优化策略,提高了DHT网络测量效率;引入重生产机制,保证数据的充分利用;引入预训练微调模型,高效、自动化地检测DHT不良文件内容;引入周期性监测策略,减少节点频繁上下线带来的误差。本发明可广泛应用于DHT网络不良内容文件发现和传播监测。
-
公开(公告)号:CN114707157A
公开(公告)日:2022-07-05
申请号:CN202210405103.0
申请日:2022-04-18
Applicant: 哈尔滨工业大学(威海)
IPC: G06F21/57 , H04L9/40 , H04L41/14 , H04L61/4511
Abstract: 本发明提供一种基于国家双边关系评估域名风险性的方法,包括以下步骤:S1、基础数据的获取,为模型确定进行基础数据支撑;S2、域名得分的计算,从基础数据中识别出与域名相关的网络实体,将基础数据项的赋值及权重代入到计算公式中得到域名得分;S3、域名风险评估,根据域名得分对域名的解析风险进行评估,根据域名得分、域名的流量以及所属机关性质确定公式计算影响值,根据影响值给出风险评估结果。该方法以国家的双边关系为基础,建立评估模型,旨在对域名安全性进行一个合理的、全面的、综合性的评估。
-
公开(公告)号:CN114357161A
公开(公告)日:2022-04-15
申请号:CN202111577072.9
申请日:2021-12-22
Applicant: 哈尔滨工业大学(威海)
Abstract: 本发明涉及一种基于证书链构建和域名文本特征的赌博域名识别方法,其解决了在不对网页文本进行解析的情况下现有赌博域名识别准确率低的技术问题,其具体步骤包括:步骤一:构建证书链特征向量;步骤二:构建证书链验证特征向量;步骤三:基于域名黑名单和N‑gram构建特征向量;步骤四:构建基于域名本身的特征解析向量;步骤五:合成步骤一到步骤四特征向量并打标签;步骤六:构建深度学习和机器学习模型识别。本发明可广泛应用于赌博域名的识别。
-
公开(公告)号:CN113630629A
公开(公告)日:2021-11-09
申请号:CN202110896220.7
申请日:2021-08-05
Applicant: 哈尔滨工业大学(威海)
IPC: H04N21/24 , H04N21/234 , H04N21/44 , H04L29/12 , H04L29/06
Abstract: 本发明提供了一种在线视频内嵌恶意域名获取及危害性评估的方法。其步骤包括:步骤1、通过动态窗口技术获取在线视频内嵌恶意域名,并获取载体视频的相关信息;步骤2、分析并抽象出在线视频内嵌恶意域名的属性并根据该属性构建在线视频内嵌恶意域名评价指标;步骤3、通过分析在线视频内嵌恶意域名的一级、二级评价指标,利用层次分析法构建危害性评价体系;步骤4、计算得出在线视频内嵌恶意域名风险值。本发明针对因在线视频数量庞大,导致在线视频内嵌恶意域名获取困难且缺乏有效的危害性评估方法的技术问题,通过发掘并提取在线视频内嵌恶意域名的多个维度的评价指标,提出了在线视频内嵌恶意域名获取及危害性评估的方法。
-
公开(公告)号:CN110569286B
公开(公告)日:2021-07-27
申请号:CN201910858112.3
申请日:2019-09-11
Applicant: 哈尔滨工业大学(威海)
IPC: G06F16/2458 , G06F16/29 , G06F21/62
Abstract: 本发明涉及数据隐私保护领域,主要是研究如何在进行个人数据收集挖掘的场景下,既能保证数据满足本地差分隐私的要求,又能保证可以从数据中挖掘出活动时序轨迹的一种基于本地差分隐私的活动时序轨迹挖掘的方法,其设有采集数据的客户端和本地客户端,采集数据的客户端在本地将采用客户端算法的原始隐私数据加噪声,使之满足隐私保护预算参数为的本地差分隐私要求,原始隐私数据会存储在本地客户端,本地客户端会从数据记录集中随机选取一对具有前后时序关系的记录,然后将其转化为时序矩阵,随后加噪处理。本发明可广泛应用于基于本地差分隐私的活动时序轨迹的挖掘。
-
-
-
-
-
-
-
-
-