-
公开(公告)号:CN114638015A
公开(公告)日:2022-06-17
申请号:CN202210296931.5
申请日:2022-03-24
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F21/62 , G06F16/903 , G06F16/242
Abstract: 本说明书实施例提供了一种数据处理方法、装置及设备,其中,该方法包括:获取针对目标业务的待检测的目标数据,以及与所述目标业务的脱敏需求对应的目标模式串,所述目标模式串包括表征预设匹配范围的模式字符;对所述目标数据中待匹配字符是否处于所述目标模式串中的模式字符对应的预设匹配范围进行匹配检测,以确定跳转距离,并根据所述跳转距离进行跳转后继续进行匹配检测,直到到达所述目标数据的匹配终止位置,得到针对所述目标数据的检测结果;基于所述检测结果,对所述目标数据进行脱敏处理,以使处理后的目标数据满足所述目标业务的脱敏需求。
-
公开(公告)号:CN114254112A
公开(公告)日:2022-03-29
申请号:CN202111572987.0
申请日:2021-12-21
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/35 , G06F16/33 , G06F16/332
Abstract: 公开了一种用于训练敏感信息预分类模型的方法,包括:构建高频词词袋,所述高频词词袋中包括敏感文本集中出现频率最高的指定数量n个词;基于所述高频词词袋,构建训练集;以及使用所述训练集来训练所述敏感信息预分类模型。本申请还涉及用于执行敏感信息预分类的方法和系统,以及相关联的装置和介质。本申请的方案能够对数据中的敏感信息进行准确地预分类,从而有利于选择更适用的敏感信息识别算法或脱敏算法。
-