目标风险网站检测方法、装置及存储介质

    公开(公告)号:CN115470488A

    公开(公告)日:2022-12-13

    申请号:CN202211045603.4

    申请日:2022-08-30

    Abstract: 本发明公开了一种目标风险网站检测方法、装置及存储介质,其中该方法包括:爬取待检测网站的第一信息,其中,第一信息包括网页快照、网站源码和网站文本;通过预先训练的BERT模型对网站源码和网站文本进行特征提取,得到网站源码特征信息和网站文本特征信息;通过预先训练的ResNet模型对网页快照进行特征提取,得到网页快照特征信息;基于网站源码特征信息、网站文本特征信息、网页快照特征信息,通过预先训练的目标风险网站检测模型判断待检测网站是否为目标风险网站。以实现以数据为主导的对目标风险网站的检测功能。本发明可广泛应用于风险网站检测领域。

    基于生成对抗网络和深度学习的有害网站的检测方法

    公开(公告)号:CN113657453A

    公开(公告)日:2021-11-16

    申请号:CN202110830095.X

    申请日:2021-07-22

    Abstract: 本发明涉及一种基于生成对抗网络和深度学习的有害网站的检测方法、装置及可读介质的技术方案,包括:通过爬虫获取若干包括有害网址的第一网站快照;将第一网站快照作为生成对抗网络的数据输入,得到多个模拟网站快照;将模拟网站快照与若干正常网站的第二网站快照进行组合,得到训练集;微调用于训练的卷积神经网络,将训练集通过卷积神经网络进行训练,得到用于有害网站的检测模型。本发明的有益效果为:所需的有标签的数据量大大减少,训练所需要的时间和计算资源也大大减少,且面对新的个性化小样本任务,本技术中提出的模型有更好的适应性,能在短时间内生成可靠的深度学习模型,提高了系统的实用价值。

    基于生成对抗网络和深度学习的有害网站的检测方法

    公开(公告)号:CN113657453B

    公开(公告)日:2023-08-01

    申请号:CN202110830095.X

    申请日:2021-07-22

    Abstract: 本发明涉及一种基于生成对抗网络和深度学习的有害网站的检测方法、装置及可读介质的技术方案,包括:通过爬虫获取若干包括有害网址的第一网站快照;将第一网站快照作为生成对抗网络的数据输入,得到多个模拟网站快照;将模拟网站快照与若干正常网站的第二网站快照进行组合,得到训练集;微调用于训练的卷积神经网络,将训练集通过卷积神经网络进行训练,得到用于有害网站的检测模型。本发明的有益效果为:所需的有标签的数据量大大减少,训练所需要的时间和计算资源也大大减少,且面对新的个性化小样本任务,本技术中提出的模型有更好的适应性,能在短时间内生成可靠的深度学习模型,提高了系统的实用价值。

Patent Agency Ranking