一种基于页面视觉相似性的仿冒网站检测方法和系统

    公开(公告)号:CN105119909B

    公开(公告)日:2019-02-19

    申请号:CN201510434950.X

    申请日:2015-07-22

    Abstract: 本发明涉及一种基于页面视觉相似性的仿冒网站检测方法和系统,包括,获取待检测网站地址列表;逐一将该列表中的网站地址与预设白名单相匹配,若匹配则允许用户访问该网站地址并对其添加白名单标记;否则将当前网站地址与预设黑名单相匹配,若匹配禁止用户访问该网站地址并对其添加黑名单标记;若当前网站地址不在预设白名单和黑名单内,则根据待检测网站地址列表对应的网页内容与预设白名单进行相似度度量,获取最大相似度值,并与预设阈值T比较;判断待检测网站地址列表中是否存在未添加标记的网站地址,若存在则重新检测,否则结束。利用该方法完成仿冒网站检测一定程度上缩减了用户访问仿冒网站的概率,降低了误入虚假网站带来的损失。

    基于流计算引擎的实时标签处理方法和装置

    公开(公告)号:CN108614862A

    公开(公告)日:2018-10-02

    申请号:CN201810265932.7

    申请日:2018-03-28

    Abstract: 本发明涉及一种基于流计算引擎的实时标签处理方法和装置,所述方法包括:步骤1、根据标签处理任务的需求设定标签处理任务类型;步骤2、根据所设定的标签处理任务类型,配置数据源信息、标签处理信息和数据输出信息;步骤3、根据所配置的数据源信息、标签处理信息和数据输出信息,生成标签处理任务配置元数据;步骤4、根据所述标签处理任务配置元数据,创建并执行所述标签处理任务。本发明通过简单配置自动化构建数据标签处理的任务流程。在标签处理任务中,根据元数据定义及标签处理规则定义进行标签处理,实现对多源数据进行标签处理,使数据标签处理过程规范化,提高了大数据实时标签处理方法的通用性和效率。

Patent Agency Ranking