-
公开(公告)号:CN116401589A
公开(公告)日:2023-07-07
申请号:CN202310210510.0
申请日:2023-03-07
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06F18/241 , G06F18/23 , G06F40/186
Abstract: 本发明提出了一种自动聚类的调证数据快速识别方法,该方法包括如下步骤:响应于建立XML语言的自定义标签的模板库;基于建立的所述模板库进行语料库的提取;将待导入文件基于提取的所述语料库进行文件TF‑IDF特征计算并提取特征,并将相同特征的文件分为一类,完成文件的自动分类;进一步进行文件模板的匹配,若匹配到模板则将匹配结果进行入库操作,否则结束。提出一种基于扩展标签模板库,同时依赖语料库完成待识别文件的特征值计算,从而完成文件集的自动分类,依托自动分类和特征值结果缓存技术,实现大量复杂文本文件的自动识别和导入的算法和完整系统解决方案,大大提升了模板识别速度和性能。
-
公开(公告)号:CN115309560A
公开(公告)日:2022-11-08
申请号:CN202210999383.2
申请日:2022-08-19
Applicant: 厦门市美亚柏科信息股份有限公司
Abstract: 本申请提出了一种基于大数据引擎的小数据量作业处理方法及装置,该方法包括以下步骤:S1、获取待处理数据文件,判断待处理数据文件是否是小数据量作业,如果是,则执行步骤S2;S2、判断资源池是否有空闲的运行时环境,如果有,则对业务代码进行统一封装,运行时环境对封装好的代码进行解释执行,如果没有,则执行步骤S3;S3、判断资源池是否达到资源容量上限,如果达到,则处理数据文件进入作业队列等待,如果没达到,则创建运行时环境放入资源池,再对业务代码进行统一封装,运行时环境对封装好的代码进行解释执行;S4、检测资源池中运行时环境的空闲时间是否超过预设阈值,如果超过,则进行运行时资源释放。
-
公开(公告)号:CN110933662B
公开(公告)日:2022-07-15
申请号:CN201911309596.2
申请日:2019-12-18
Applicant: 厦门市美亚柏科信息股份有限公司
Abstract: 本申请公开了一种基于数据挖掘的时空伴随关系分析方法和系统。基于同一双卡移动设备的IMEI识别码规则获得各个双卡移动设备IMEI信号数据库;当两个或者两个以上的基站捕获到多组在较短时间区间内上报的归属同一双卡移动设备的IMEI信号数据时,将该两个或者两个以上的基站认定为具有相邻关系的基站,从而构建具有相邻关系的相邻基站组;遍历目标基站及相邻基站组中的属于目标基站的相邻基站的IMEI信号数据,查找与目标对象IMEI识别码存在时间交互差值的交互对象IMEI识别码,进一步获得目标对象的伴随对象。该方案通过提取IMEI信号数据库和相邻基站组,利用目标基站和目标基站的伴随基站获取目标对象的伴随对象。
-
公开(公告)号:CN114445222A
公开(公告)日:2022-05-06
申请号:CN202111541001.3
申请日:2021-12-16
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06Q40/04 , G06F16/904 , G06F16/9038 , G06Q20/34
Abstract: 本发明涉及一种资金交易追踪方法、终端设备及存储介质,该方法中包括:S1:接收待进行资金追踪分析的交易数据,对交易数据进行解析以提取每条交易数据的交易类型、本人卡号和对方卡号,并存入交易数据记录表;S2:选取一条交易数据作为第一级交易流水,将交易数据从交易数据记录表中删除;S3:基于上一级交易流水对应的交易数据的交易类型、本人卡号和对方卡号,根据追踪方式从数据库中查找下一级交易流水对应的交易数据后,将查找到的交易数据从交易数据记录表中删除;重复执行步骤S3,直到交易数据记录表为空,进入S4;S4:对所有交易流水进行可视化展示。本发明可以以更加直观的视觉效果快速定位可疑资金交易来源和去向。
-
公开(公告)号:CN114443694A
公开(公告)日:2022-05-06
申请号:CN202111613331.9
申请日:2021-12-27
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06F16/245 , G06F16/28 , G06Q50/26
Abstract: 本发明涉及一种线索多维度关联关系分析方法、终端设备及存储介质,该方法中包括:采集案件关联的通联数据,并提取线索信息和线索持有人信息;按照持有人所属的团伙、持有人和线索三个维度分别对所有线索信息进行分组,并将分组结果存储于各维度对应的分组列表内;按照分组维度,对每个组与其他组之间的所有通联特征进行统计计算,并将统计结果对应保存至各分组维度对应的通联结果列表内;S4:根据线索需要显示的分组维度和通联特征提取分组信息和通联结果后进行可视化显示。本发明相比传统的单一维度分析方法,更加灵活高效,降低了人对图形的阅读和观察时间,提升了工作效率。
-
公开(公告)号:CN114443629A
公开(公告)日:2022-05-06
申请号:CN202111591763.4
申请日:2021-12-23
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06F16/215 , G06F16/22
Abstract: 本发明涉及一种集群布隆过滤器数据去重方法、终端设备及存储介质,该方法中包括:接收数据记录并写入消息队列;计算数据记录对应的排重键值;计算该消息记录对应的存储索引号i;将集群布隆过滤器中第i个过滤器槽中存储该消息记录对应的位向量,并初始化为0;通过k个散列函数分别对该消息记录对应的排重键值进行运算,根据k个运算结果将该消息记录对应的位向量中对应位置元素的值置1;对于待查找数据记录,根据其在集群布隆过滤器中对应过滤器槽中存储的位向量中对应元素的值是否为1来判断是否重复。本发明解决了实时数据去重负载过大难题。
-
公开(公告)号:CN116578641A
公开(公告)日:2023-08-11
申请号:CN202310298879.1
申请日:2023-03-24
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06F16/27 , G06F16/22 , G06F16/2458 , G06F16/21
Abstract: 公开了一种基于ketama算法的分库方法和系统,包括创建哈希环,利用ketama_hash对服务器信息进行哈希取值获得第一哈希值,并将第一哈希值映射至哈希环上;对数据中的key进行md5计算,再使用ketama_hash计算第二哈希值,并将第二哈希值映射至哈希环上;从哈希环上的第二哈希值处顺时针查找,将数据保存于找到的第一台服务器上。本申请解决了分库节点变化后引起的数据迁移量问题,并且加入复制因子参数,通过虚拟节点解决节点分布不均匀的问题。
-
公开(公告)号:CN116467294A
公开(公告)日:2023-07-21
申请号:CN202310303910.6
申请日:2023-03-27
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06F16/215 , G06F16/21 , G06F16/22 , G06F16/23 , G06F16/245
Abstract: 本发明公开了一种人员信息数据整合方法,包括:S101、创建人员基础库,人员基础库用于导入人员信息数据并形成人员信息表,人员基础库具有多个分库表;S102、确定数据记录的排重键,基于排重键对人员信息数据进行去重;S103、将去重后的所述人员信息数据均分至不同的所述分库表中;S104、将人员信息数据与所述人员信息表进行匹配,其中,响应于人员信息数据为异常数据,根据可信度权值选取异常数据中可信度最高的一条作为人员属性所对应的人员信息数据与人员信息表进行匹配,异常数据为针对同一人员属性的多条内容不一致的人员信息数据。本发明能够更好地进行负载均衡,从而保证以较快的速度进行查询和更新处理,数据选取的准确度也更高。
-
公开(公告)号:CN114595379A
公开(公告)日:2022-06-07
申请号:CN202210049884.4
申请日:2022-01-17
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06F16/9535 , G06F16/9035 , G06F40/289 , G06K9/62
Abstract: 本发明公开一种数据标准的智能推荐方法及装置,先通过对源表信息进行分词划分提取出与源表信息对应的关键词,通过关键词在数据库中匹配相关的数据标准名,得到相关的多组数据标准表;而后通过预设的评分规则对搜索出的多组数据标准表进行第一次筛选,挑选出预设数量的较相关数据标准表,再对挑选出的每一数据标准表的所有数据项采用相似度累积计算方法与源表信息内的所有数据项进行二次筛选,得到与源表信息最匹配的数据标准表,从而依次通过二次不同程度的筛选提升相似度比对效率以及准确率,同时也减轻了计算机比对运算次数,极大的减轻了接入人员工作负担,以及数据标准对标过程中出现的误对问题。
-
公开(公告)号:CN114444115A
公开(公告)日:2022-05-06
申请号:CN202111550916.0
申请日:2021-12-17
Applicant: 厦门市美亚柏科信息股份有限公司
Abstract: 本发明涉及一种数据脱敏方法、终端设备及存储介质,该方法中包括:基于待脱敏的姓名或身份证号中的具有固定数量种类的特征构建对应的特征集;从特征集中查找对应特征所在的位置,并将查找到的位置与固定偏移量的运算结果作为该特征对应的脱敏后的特征在特征集中的位置,进而获得脱敏后的特征;结合脱敏前或脱敏后的特征在特征集中的位置,计算其他特征对应的脱敏后的特征;将所有脱敏后的特征按顺序拼接为脱敏后的姓名或身份证号。本发明使得脱敏后的即保留了原有格式,又使其与真实数据混淆在一起也无法立即分辨出来。
-
-
-
-
-
-
-
-
-