-
公开(公告)号:CN114357161A
公开(公告)日:2022-04-15
申请号:CN202111577072.9
申请日:2021-12-22
Applicant: 哈尔滨工业大学(威海)
Abstract: 本发明涉及一种基于证书链构建和域名文本特征的赌博域名识别方法,其解决了在不对网页文本进行解析的情况下现有赌博域名识别准确率低的技术问题,其具体步骤包括:步骤一:构建证书链特征向量;步骤二:构建证书链验证特征向量;步骤三:基于域名黑名单和N‑gram构建特征向量;步骤四:构建基于域名本身的特征解析向量;步骤五:合成步骤一到步骤四特征向量并打标签;步骤六:构建深度学习和机器学习模型识别。本发明可广泛应用于赌博域名的识别。
-
公开(公告)号:CN114841256A
公开(公告)日:2022-08-02
申请号:CN202210417073.5
申请日:2022-04-20
Applicant: 哈尔滨工业大学(威海)
IPC: G06K9/62 , G06F16/215 , H04L61/4511
Abstract: 本发明提供一种基于多维特征融合的DGA域名分类方法,包括以下步骤:步骤1,建立良性域名与DGA域名的数据集;步骤2,对步骤1获取到的数据集进行处理,并且划分数据得到训练集和测试集;步骤3,对步骤2得到的训练集和测试集中每个域名进行字符特征、熵特征和统计特征的提取,得到特征向量,并打上对应的标签,最后得到九维的向量;步骤4,构建DGA域名挖掘模型。该方法能够以较高的准确率、高效快速的识别DGA域名,并且相较于其他发明能够以较少的特征达到较高的准确率。
-
公开(公告)号:CN114372144A
公开(公告)日:2022-04-19
申请号:CN202111577064.4
申请日:2021-12-22
Applicant: 哈尔滨工业大学(威海)
Abstract: 本发明涉及一种基于证书和域名解析的赌博域名识别方法,其解决了在不对网页文本进行解析的情况下现有赌博域名识别准确率低的技术问题,其步骤包括建立基于Bert微调构建中文分类模型;分别对所述中文赌博域名及良性域名进行数字证书解析;通过N‑gram方法获取域名的文本特征向量;通过RNN、DecisionTree、ExtraTree、RandomForest、KNN及SVM学习算法对中文赌博域名以及良性域名的数字证书解析特征向量和域名文本特征向量进行训练和测试,构建中文赌博域名挖掘模型。本发明可广泛应于中文赌博域名的识别。
-
-