-
公开(公告)号:CN116502153A
公开(公告)日:2023-07-28
申请号:CN202310392001.4
申请日:2023-04-13
Applicant: 中国科学院计算技术研究所
IPC: G06F18/243 , H04L61/4511 , H04L61/103 , G06F18/213 , G06N3/0442 , G06N3/08
Abstract: 本发明提供一种用于域名分类的分类模型构建方法,所述分类模型为随机森林模型,且所述随机森林模型中包括多个决策树分类器,所述方法包括如下步骤:S1、获取来自于DNS服务器的DNS响应数据并对其进行预处理以得到带域名类型标签的训练集,其中,所述域名类型标签为一次性域名标签或非一次性域名标签;S2、对步骤S1得到的训练集进行多种特征提取以获取训练集中每个域名样本对应的特征集合;S3、基于经步骤S2进行特征提取后的训练集,以域名样本对应的特征集合为输入,域名样本类型为输出构建随机森林模型。本发明采用由多个决策树分类器组成的随机森林模型进行域名分类,以缓解现有方法中预测时间长、检测效率低的问题。