一种基于URL特征的网站首页识别方法及电子装置

    公开(公告)号:CN114201698A

    公开(公告)日:2022-03-18

    申请号:CN202010981078.1

    申请日:2020-09-17

    Abstract: 本发明提供一种基于URL特征的网站首页识别方法及电子装置,包括剔除待识别URL首部的http://字符或者https://字符,获取包含http://字符或https://字符的临时变量t1;按照“/”字符对临时变量t1进行拆分,并进行有效性判断;若不能拆分或仅能拆成两部分且第二部分为空,则判断临时变量t1是否包含是二级、三级或四级域名;若仅能拆成两部分、第二部分不为空且第二部分长度小于第一阈值,则判断第二部分是否包含特定字符;若临时变量t1包含是二级、三级或四级域名或第二部分包含特定字符,则判断待识别URL为首页URL。本发明无需训练分类器、人工标注大量数据集及对URL页面内容进行分析,解决了通过语义无法识别嵌套URL的情况,降低了误报率,节省人力与网络资源,提升了识别速度。

    一种基于多源分析的诈骗话题检测方法及装置

    公开(公告)号:CN112925971A

    公开(公告)日:2021-06-08

    申请号:CN202110084724.9

    申请日:2021-01-21

    Abstract: 本发明公开了一种基于多源分析的诈骗话题检测方法及装置,该方法包括:综合运用大数据处理框架,结合外部系统提供的数据接口,获取多维数据;根据制定的统一数据标准,对所述多维数据进行号码规范化、数据去重、关联合并、数据融合处理;对处理后的所述多维数据进行特征分析,基于所述特征分析结果,构建智能诈骗事件识别模型,利用所述识别模型对诈骗场景和诈骗事件识别,多维综合分析识别的数据信息;在展示界面和外部系统,推送和呈现所述多维数据综合分析识别数据信息结果。本发明通过对涉诈团伙、涉诈行为和事件、受害人进行综合数据分析,分类检出了各类诈骗事件,分析出了溯源诈骗黑色产业链,从而深入打击诈骗犯罪。

    一种基于结构化数据的脱敏方法、装置与系统

    公开(公告)号:CN111950022A

    公开(公告)日:2020-11-17

    申请号:CN202010797136.5

    申请日:2020-08-10

    Abstract: 本发明公开一种基于结构化数据的脱敏方法、装置与系统,所述方法包括:接收结构化数据,对所述结构化数据进行拆分,生成拆分数据;对拆分数据进行匿名化处理或去标识化处理,生成匿名化拆分数据或去标识化处理数据;组合匿名化拆分数据或去标识化处理数据,生成匿名化数据或去标识化数据。本发明可对大规模的结构化数据进行脱敏处理,为进一步拓展数据应用,增强数据分析效果提供数据保护方面的有效支持。对于结构化数据脱敏技术,本发明采用匿名化、去标识化方式对结构化数据进行脱敏,可对结构化数据中敏感字段进行脱敏处理,脱敏的标准为不可对应识别个体信息。脱敏后的数据保证数据的独立性和可区分性。去标识化的数据能够数据恢复。

Patent Agency Ranking