一种套路贷网站团伙识别方法及系统

    公开(公告)号:CN111754338A

    公开(公告)日:2020-10-09

    申请号:CN202010615836.8

    申请日:2020-06-30

    Abstract: 本发明公开了一种套路贷团伙识别方法及系统,包括构建套路贷网站识别模型;根据套路贷网站黑名单库,获取套路贷网站的主要特征,并利用网络爬虫技术,爬取更多疑似套路贷网站的页面内容,并通过所述的套路贷网站识别模型进行识别,然后将识别为套路贷网站放入黑名单库中,得到新的黑名单库;针对新的黑名单库,通过套路贷网站的特征数据构建关系图,计算出每个特征节点所在的连通子图以及连通子图的节点数,最终识别团伙。本发明结合犯罪分子即贷款网站层面构建特征,挖掘潜在套路贷网站,并基于套路贷网站特征构对已识别出的套路贷网站构建无向图,然后计算识别出套路贷网站团伙,兼顾了套路贷网站识别的广度和深度。

    一种用于敏感数据泄露检测的关键词语义分类方法与系统

    公开(公告)号:CN111694961A

    公开(公告)日:2020-09-22

    申请号:CN202010578950.8

    申请日:2020-06-23

    Abstract: 本发明公开了一种用于敏感数据泄露检测的关键词语义分类方法及系统,具体步骤如下:步骤1,输入敏感关键词库;步骤2,使用自然语言处理技术对关键词库向量化;步骤3,对每个关键词对应的向量数据降维;步骤4,对已经降维的向量数据,进行聚类分析;骤5,对已经完成聚类分析的关键词向量,结合业务对关键词类别进行标识;步骤6,根据所以已经标识的类别标签,对每个类别进行关键词分组优化;步骤7,输出敏感关键词库类别。以向量化形式表达词汇,以达到对词汇的分类分级;基于特定类别的词汇,使用相似度计算,优化词汇分类;将庞大的关键词库分类细化,提高了使用者的工作效率和指定领域的数据匹配精准度。

    一种伪造MAC群体的发现方法及装置

    公开(公告)号:CN110995696A

    公开(公告)日:2020-04-10

    申请号:CN201911201574.4

    申请日:2019-11-29

    Abstract: 本发明实施例提供了一种伪造MAC群体的发现方法及装置,所述方法包括:针对待识别MAC地址集合中的每一个待识别MAC地址,将待识别MAC地址分割成至少两个字符串;将待识别MAC地址两两组合,得到MAC地址对;获取MAC地址对中包括的MAC地址之间的距离;筛选出地址之间距离小于第一预设阈值的MAC地址对,将MAC地址对中的MAC地址作为关系图的节点,且在MAC地址对之间作边,得到初始关系图;从初始关系图中获取顶点数量大于第二预设阈值的子连通图,并将该子连通图对应的MAC地址作为伪造MAC地址群体。应用本发明实施例,可以解决现有技术无法识别伪造MAC地址的技术问题。

    一种账号异常访问敏感数据行为的检测方法及系统

    公开(公告)号:CN110750786A

    公开(公告)日:2020-02-04

    申请号:CN201911045981.0

    申请日:2019-10-30

    Abstract: 本发明提供一种账号异常访问敏感数据行为的检测方法及系统,包括以下步骤:S01,获取数据库操作日志;S02,从数据库操作日志中解析SQL语句,生成账号访问数据表的记录;S03,生成各账号类型的访问行为基准向量;S04,生成各账号的访问行为向量;S05,使用相似度算法,输出特定账号和所有非归属账号类型的相似度集合;S06,通过所述相似度集合中的值大小确定异常访问风险水平。本发明的有点在于,将传统监管机制的粒度从数据库下沉到数据表,特别是对于含有敏感数据的表,为企业保护隐形资产和用户隐私提供有效手段;使用历史数据生成基准,避免人为确定阈值的主观性;量化访问风险,输出风险等级,而且余弦相似度的计算简单方便,结果具有可解释性。

    一种基于网站文本内容的网贷网站实体识别方法及系统

    公开(公告)号:CN111078978B

    公开(公告)日:2024-02-27

    申请号:CN201911209943.4

    申请日:2019-11-29

    Abstract: 本发明提供一种基于网站文本内容的网贷网站实体识别方法及系统,包括S01、构建训练集域名表;S02、构建预测集域名表;S03、数据清洗与预处理;S04、文本分类模型训练,得到目标文本分类模型;S05、网贷网站识别,将预测集域名表中每个样本的目标网页内容字段输入值目标文本分类模型,输出每个样本对应的是否为网贷网站字段;S06、命名实体识别模型训练,得到目标命名实体识别模型;S07、实体名称标注。本发明基于运营商DPI数据,获取用户访问的网站域名host,获得网页内容并识别出网贷网站,同时利用命名实体识别技术提取出网贷网站中实体名称,进而结合外部黑名单数据,对一些不良网站打标,建立企业黑名单库,这种方法准确率高,

    一种针对模型倾斜攻击的检测方法及系统

    公开(公告)号:CN112733140B

    公开(公告)日:2023-12-22

    申请号:CN202011605328.8

    申请日:2020-12-28

    Abstract: 本发明一种针对模型倾斜攻击的检测方法及系统,包括以下步骤:步骤S1,获取被篡改的训练数据集data11,测试数据集data22;步骤S2,对数据集样本进行分词处理,得到N维的样本数据特征向量V;步骤S3,对N维的样本数据特征向量V进行编码,生成样本指纹;步骤S4,对所得到的指纹进行相似度匹配,得到相似度高的样本集即为篡改数据。本发明所提供的一种针对存在大量相似文本的训练数据导致模型分类产生倾斜的攻击方式的检测方法,通过人为修改样本数据,保证样本数据存在大量重复,样本数据更准确,基于指纹相似度匹配可快速识别。另外,本发明所提供的检测方法还可应用在模型反馈机制武器化的检测上,通过对海量反馈信息进行相似度匹(56)对比文件姜雪等.基于语义指纹的海量文本快速相似检测算法研究《.电脑知识与技术》.2016,(第36期),

    基于颜色分量和感知哈希算法的人像采集环境验证方法及系统

    公开(公告)号:CN110969202B

    公开(公告)日:2023-12-19

    申请号:CN201911193699.7

    申请日:2019-11-28

    Abstract: 本发明公开了一种基于颜色分量和感知哈希算法的人像采集环境验证方法及系统,包括S100,获取样本数据集合;S200,预处理样本数据,包括正样本和负样本;S300,针对预处理的样本数据,生成数据集D;S400,使用支持向量机分类算法结合数据集D进行分类模型训练,得到训练完成的分类模型;S500,对待检验的人像图片和环境图片,使用分类模型进行预测,输出是否匹配的预测结果。本发明采用感知哈希算法可以有效获得图像的重要内容特征,而颜色分量统计算法从颜色角度出发,弥补了前述算法对颜色信息的计算缺陷,并将两种方法所计算的相似度结(56)对比文件Choi, YS ET AL.Image hash generationmethod using hierarchical histogram.《MultiMedia Tools and applications》.2012,赵佳等.结合裁剪技术的颜色特征匹配搜索《.宜宾学院学报》.2016,(第06期),

Patent Agency Ranking