检测有害URL的方法、系统、电子设备及存储介质

    公开(公告)号:CN115098806A

    公开(公告)日:2022-09-23

    申请号:CN202210687729.5

    申请日:2022-06-17

    Abstract: 本发明技术方案提供了一种检测有害URL的方法、系统、电子设备及存储介质,该方法包括:获取URL数据,其中,URL数据包含有害URL数据和正常URL数据;根据URL数据创建词特征,其中,词特征用于归纳URL数据所具有的特征;根据URL数据创建训练集和测试集,统计训练集中URL数据的词特征;根据训练集中URL数据的词特征构建决策树并生成随机森林模型;根据随机森林模型对测试集进行有害URL数据的识别。采用此技术方案可以提高URL检测的效率和准确度,并减少计算机的算力资源消耗。

    互联网有害事件的检测方法、装置和存储介质

    公开(公告)号:CN116304071A

    公开(公告)日:2023-06-23

    申请号:CN202211323446.9

    申请日:2022-10-27

    Abstract: 本申请公开了互联网有害事件的检测方法、装置和存储介质,本申请构造或更新关键词知识图谱,并将知识图谱划分为若干子图;利用聚类算法将文档聚类到有害事件中;通过更新每个有害事件,将每个有害事件插入到有害故事树中,或者根据有害事件创建一个新的有害故事树,实现了移动互联网和互联网中的有害内容检测和分类,目的是从海量的网页及文档数据中发现有害事件,以在线方式以合理的有害故事树组织有害事件;提出了一种基于知识图谱的两层网页文档聚类算法,从大量的网页文本或网页相关新闻中提取有害事件,在新的网页及文档数据到达后,使用在线算法将事件组织成故事树,在有害事件提取方面比传统基于关键词的恶算法更有效。

Patent Agency Ranking