-
公开(公告)号:CN111062422A
公开(公告)日:2020-04-24
申请号:CN201911200313.0
申请日:2019-11-29
Applicant: 上海观安信息技术股份有限公司
Abstract: 本发明提供了一种套路贷体系化识别方法及装置,方法包括:1)、获取用户的网络行为数据,使用网络行为数据训练Xgboost模型,使用Xgboost模型识别出具有资金需求的用户;2)、将所述用户的历史通话数据、当前周期内通话数据以及黑名单库清单数据作为训练集训练预先构建的随机森林模型,并使用该训练好的随机森林模型输出测试集中用户属于具有寻找资金行为的用户的分类概率值;3)、根据所述用户的账户交易数据,利用贝叶斯模型输出测试集中用户为已经接收资金的用户的分类概率值;4)、将训练后的模型体系作为套路贷体系化识别模型,以对待识别用户属于套路贷受害者的概率进行检测。应用本发明实施例,可以识别出套路贷犯罪行为。
-
公开(公告)号:CN110826320A
公开(公告)日:2020-02-21
申请号:CN201911195301.3
申请日:2019-11-28
Applicant: 上海观安信息技术股份有限公司
IPC: G06F40/284 , G06F16/45 , G06F21/62
Abstract: 本发明一种基于文本识别的敏感数据发现方法,包括以下步骤:S01、样本数据提取;S02、构建训练样本,搜集文本数据集,构建训练样本;S03、训练样本标注模型,基于S02中获得训练样本,训练文本标注模型;S04、数据特征构建;S05、训练集构建,对S04得到的数据集进行标签刻画,形成用于构建分类判断模型的训练集;S06、构建分类判断模型,根据S05得到的训练集,形成变量预测模型;S07、模型测试。本发明通过对数据变量的识别,能够在数据字典和匹配规则不完整的情况下,可以精准、高效的对敏感数据进行判断识别,并保证识别和分类结果的一致性。
-
公开(公告)号:CN110784470A
公开(公告)日:2020-02-11
申请号:CN201911045663.4
申请日:2019-10-30
Applicant: 上海观安信息技术股份有限公司
IPC: H04L29/06
Abstract: 本发明实施例提供了一种用户异常登录的确定方法,所述方法包括:1)、获取登录接口日志,并将所述登录接口日志处理成结构化数据;2)、利用异常登录算法识别出发生异常的对象,其中,所述对象包括:异常登录账号、异常IP、异常MAC;3)、根据发生异常的对象,利用图数据库,构建以异常登录对象为节点的关系型网络结构图,并根据所述关系型网络结构图获取分别与异常登录对象具有连接关系的节点,将这些节点对应的账号、IP、MAC的集合作为异常登录对象。本发明实施例提供了一种用户异常登录的装置,应用本发明实施例,提高了安全性。
-
公开(公告)号:CN114254705B
公开(公告)日:2025-03-21
申请号:CN202111574028.2
申请日:2021-12-21
Applicant: 上海观安信息技术股份有限公司
IPC: G06F18/2433
Abstract: 本发明公开了一种异常数据的检测方法、装置、存储介质及计算机设备,涉及信息技术领域,主要在于能够提高异常数据的检测效率和检测精度。其中方法包括:获取待检测数据集对应的属性特征;将所述属性特征输入至预设异常检测算法预测模型中进行算法预测,得到所述待检测数据集适用的目标异常检测算法;利用所述目标异常检测算法对所述待检测数据集中的异常数据进行检测,得到所述待检测数据集对应的异常数据检测结果。本发明适用于对异常数据进行检测。
-
公开(公告)号:CN113704761B
公开(公告)日:2024-06-28
申请号:CN202111016033.1
申请日:2021-08-31
Applicant: 上海观安信息技术股份有限公司
IPC: G06F21/56
Abstract: 本发明公开了一种恶意文件的检测方法、装置、计算机设备及存储介质,涉及信息技术领域,主要在于能够减轻恶意文件检测的计算压力。其中方法包括:获取待检测文件对应的调用接口序列;确定所述调用接口序列对应的特征序列,并根据所述特征序列,确定所述待检测文件对应的最小哈希签名;根据所述待检测文件对应的最小哈希签名,将所述待检测文件分配到不同哈希区间下相应的哈希桶中,其中,任意一个哈希区间下存在多个哈希桶;确定在所述不同哈希区间下与所述待检测文件分配到同一个哈希桶中的第一目标样本文件;根据所述第一目标样本文件对应的类别信息,判定所述待检测文件是否为恶意文件。本发明适用于恶意文件的检测。
-
公开(公告)号:CN113904921B
公开(公告)日:2024-04-30
申请号:CN202111227745.8
申请日:2021-10-21
Applicant: 上海观安信息技术股份有限公司
IPC: H04L41/069 , H04L41/12 , H04L41/22 , H04L43/08 , G06F16/36
Abstract: 本发明公开一种基于日志和图的动态网络拓扑图生成方法,包括:S1,数据收集,通过流的方式收集各服务器流量、ssh、ftp、web系统日志;S2,数据解析,从步骤S1收集的各类日志中解析各服务器的特征信息;S3,图谱创建,利用步骤S2解析出的特征信息构建有向图;所述有向图的边的方向有连接发起者指向被访问服务器;S4,网络拓扑状态查询,利用步骤S3中创建的有向图,查询网络拓扑状态。本发明根据服务器之间的连接、流量等日志,解析服务器之间的关系,存在关系的服务器必然是存在数据交换的活跃状态,解析出连接关系后创建图,可以随时发现网络的变化,利用图的概念和相关算法,可用根据边进行任意时间段的网络活跃情况展示以及内网用户行为的分析。
-
公开(公告)号:CN111753547B
公开(公告)日:2024-02-27
申请号:CN202010610999.7
申请日:2020-06-30
Applicant: 上海观安信息技术股份有限公司
IPC: G06F40/295 , G06F40/216 , G06Q10/107 , G06F16/35 , G06F16/31
Abstract: 本发明公开了一种用于敏感数据泄露检测的关键词提取方法及检测系统,包括对源文本数据进行清洗,去时间、日期,得到目标文档;针对目标文档,采用TF‑IDF算法进行关键词提取,得到TF‑IDF关键词候选;针对目标文档,进行非中文处理,得到邮箱、URL、IP、手机号、最长公共子串关键词;将得到的TF‑IDF关键词候选与邮箱、URL、IP、手机号、最长公共子串关键词进行剔重
-
公开(公告)号:CN113722199B
公开(公告)日:2024-01-30
申请号:CN202111045796.9
申请日:2021-09-07
Applicant: 上海观安信息技术股份有限公司
IPC: G06F18/2433 , G06Q30/0207
Abstract: 本发明公开了一种异常行为检测方法、装置、计算机设备及存储介质,涉及信息技术领域,主要在于能够避免造成用户行为数据统计上的偏差,从而能够提高用户异常行为的检测精度。其中方法包括:获取待检测用户的多个操作行为分别对应的操作时间;基于所述操作时间,确定按照时间顺序排序的多个操作时间间隔;计算所述多个操作时间间隔共同对应的周期分割阈值,并根据所述周期分割阈值,确定所述多个操作时间间隔中存在的周期间时间间隔;基于所述周期间时间间隔,将所述多个操作时间间隔划分成不同的时间窗口;根据所述待检测用户在所述不同时间窗口下的操作频次,判定所述待检测用户是否存在异常操作行为。本发明适用于异常行为的检测。
-
公开(公告)号:CN114338593B
公开(公告)日:2023-07-04
申请号:CN202111594056.0
申请日:2021-12-23
Applicant: 上海观安信息技术股份有限公司
IPC: H04L61/103 , H04L9/40
Abstract: 本申请公开了一种利用地址解析协议进行网络扫描的行为检测方法及装置、存储介质和计算机设备。方法包括:获取通信信息,其中,通信信息包括源地址、目的地址、请求时间以及请求结果;根据目的地址以及请求时间,确定源地址对应的请求规律;根据请求规律确定请求规律得分,根据源地址对应的请求结果确定请求结果得分,根据源地址对应的目的地址确定请求广度得分;根据请求规律得分、请求结果得分以及请求广度得分,在多个通信信息对应的源地址中,确定与网络扫描对应的目标源地址,并确定目标源地址对应的目标请求为网络扫描行为。本申请的方法,提高了ARP网络扫描行为检测的准确率。
-
公开(公告)号:CN111752727B
公开(公告)日:2023-06-20
申请号:CN202010611005.3
申请日:2020-06-30
Applicant: 上海观安信息技术股份有限公司
IPC: G06F9/54 , G06F16/242 , G06F16/25 , G06F16/28
Abstract: 本发明提供了一种基于日志分析的数据库三层关联的识别方法,通过对request日志和sql日志进行筛选和处理,通过时间窗口特征获得主体对象的相关率,并结合参数相关值确定三层关联关系。本发明提供的基于日志分析的数据库三层关联的识别方法的优点在于:仅通过对request和sql日志进行分析,就能精准识别出数据库的三层关联,不需要对系统进行改造,成本较低,在得到表K后能够对现有日志进行三层关联识别,对新的日志进行三层关联的预测,而且本发明提供的方法是根据历史数据不断更新的,能够不断学习,随着数据样本越来越多,识别的准确性也越来越高;通过参数的相关值和主体对象的相关率综合考虑关联性排序,识别结果准确。
-
-
-
-
-
-
-
-
-