一种基于页面视觉相似性的仿冒网站检测方法和系统

    公开(公告)号:CN105119909B

    公开(公告)日:2019-02-19

    申请号:CN201510434950.X

    申请日:2015-07-22

    Abstract: 本发明涉及一种基于页面视觉相似性的仿冒网站检测方法和系统,包括,获取待检测网站地址列表;逐一将该列表中的网站地址与预设白名单相匹配,若匹配则允许用户访问该网站地址并对其添加白名单标记;否则将当前网站地址与预设黑名单相匹配,若匹配禁止用户访问该网站地址并对其添加黑名单标记;若当前网站地址不在预设白名单和黑名单内,则根据待检测网站地址列表对应的网页内容与预设白名单进行相似度度量,获取最大相似度值,并与预设阈值T比较;判断待检测网站地址列表中是否存在未添加标记的网站地址,若存在则重新检测,否则结束。利用该方法完成仿冒网站检测一定程度上缩减了用户访问仿冒网站的概率,降低了误入虚假网站带来的损失。

    基于流计算引擎的实时标签处理方法和装置

    公开(公告)号:CN108614862A

    公开(公告)日:2018-10-02

    申请号:CN201810265932.7

    申请日:2018-03-28

    Abstract: 本发明涉及一种基于流计算引擎的实时标签处理方法和装置,所述方法包括:步骤1、根据标签处理任务的需求设定标签处理任务类型;步骤2、根据所设定的标签处理任务类型,配置数据源信息、标签处理信息和数据输出信息;步骤3、根据所配置的数据源信息、标签处理信息和数据输出信息,生成标签处理任务配置元数据;步骤4、根据所述标签处理任务配置元数据,创建并执行所述标签处理任务。本发明通过简单配置自动化构建数据标签处理的任务流程。在标签处理任务中,根据元数据定义及标签处理规则定义进行标签处理,实现对多源数据进行标签处理,使数据标签处理过程规范化,提高了大数据实时标签处理方法的通用性和效率。

    一种基于多源标签弱监督学习的安全日志分析方法

    公开(公告)号:CN119835037A

    公开(公告)日:2025-04-15

    申请号:CN202411949295.7

    申请日:2024-12-27

    Abstract: 本发明涉及网络安全技术领域,公开了一种基于多源标签弱监督学习的安全日志分析方法,方法包括:在标签日志数据集中获取相似日志样本,并将相似日志样本组合为子样本集合;以子样本集合中各个日志样本的类型相同为目标,通过目标分类器,对子样本集合中日志样本的各个标签对应的对比权重进行更新,获得权重值矩阵;对比权重用于指示日志样本的候选标签信息与其他预测标签的差异距离;基于权重值矩阵生成目标样本日志对应的目标标签,并根据目标样本日志以及目标标签对日志分析模型进行训练;其中,训练后的日志分析模型用于对安全日志进行分析。本发明能够提高安全日志分析的准确性。

Patent Agency Ranking