-
公开(公告)号:CN113988313B
公开(公告)日:2024-10-15
申请号:CN202111289272.4
申请日:2021-11-02
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N20/00 , G06F16/901 , G06F16/903
Abstract: 本说明书实施例提出了一种用户数据的删除方法、装置和电子设备,其中,上述用户数据的删除方法中,服务器获取删除用户数据的请求之后,在第一训练数据中查找上述请求中携带的用户标识所对应的用户数据,如果查找到上述用户标识对应的用户数据,则从上述第一训练数据中删除查找到的用户数据,并利用删除上述用户数据之后的第二训练数据,重新训练机器学习模型,从而可以实现从训练数据和生成的机器学习模型中删除指定用户的数据,满足合规要求,还可以重新训练并发布新的机器学习模型。
-
公开(公告)号:CN116089422A
公开(公告)日:2023-05-09
申请号:CN202211676623.1
申请日:2022-12-26
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/22 , G06F16/2455
Abstract: 本说明书一个或多个实施例公开了一种数据的处理方法及装置。所述方法包括:获取指定时间段内产生的日志数据;针对每条所述日志数据,按照预设泛化方式对所述日志数据进行泛化处理,得到与所述日志数据对应的第一数据;所述第一数据与至少一条所述日志数据相对应;根据所述第一数据确定所述日志数据的第一索引数据,并将所述第一索引数据存储至第一存储区域;根据所述第一索引数据,对所述指定时间段内产生的日志数据进行分区处理,得到至少一个第一数据分区,并将所述第一索引数据和所述至少一个第一数据分区对应存储至第二存储区域;每个所述第一数据分区中的每条所述日志数据均与同一个所述第一索引数据相对应。
-
公开(公告)号:CN113988313A
公开(公告)日:2022-01-28
申请号:CN202111289272.4
申请日:2021-11-02
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N20/00 , G06K9/62 , G06F16/901 , G06F16/903
Abstract: 本说明书实施例提出了一种用户数据的删除方法、装置和电子设备,其中,上述用户数据的删除方法中,服务器获取删除用户数据的请求之后,在第一训练数据中查找上述请求中携带的用户标识所对应的用户数据,如果查找到上述用户标识对应的用户数据,则从上述第一训练数据中删除查找到的用户数据,并利用删除上述用户数据之后的第二训练数据,重新训练机器学习模型,从而可以实现从训练数据和生成的机器学习模型中删除指定用户的数据,满足合规要求,还可以重新训练并发布新的机器学习模型。
-
公开(公告)号:CN114638015A
公开(公告)日:2022-06-17
申请号:CN202210296931.5
申请日:2022-03-24
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F21/62 , G06F16/903 , G06F16/242
Abstract: 本说明书实施例提供了一种数据处理方法、装置及设备,其中,该方法包括:获取针对目标业务的待检测的目标数据,以及与所述目标业务的脱敏需求对应的目标模式串,所述目标模式串包括表征预设匹配范围的模式字符;对所述目标数据中待匹配字符是否处于所述目标模式串中的模式字符对应的预设匹配范围进行匹配检测,以确定跳转距离,并根据所述跳转距离进行跳转后继续进行匹配检测,直到到达所述目标数据的匹配终止位置,得到针对所述目标数据的检测结果;基于所述检测结果,对所述目标数据进行脱敏处理,以使处理后的目标数据满足所述目标业务的脱敏需求。
-
公开(公告)号:CN114254112A
公开(公告)日:2022-03-29
申请号:CN202111572987.0
申请日:2021-12-21
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/35 , G06F16/33 , G06F16/332
Abstract: 公开了一种用于训练敏感信息预分类模型的方法,包括:构建高频词词袋,所述高频词词袋中包括敏感文本集中出现频率最高的指定数量n个词;基于所述高频词词袋,构建训练集;以及使用所述训练集来训练所述敏感信息预分类模型。本申请还涉及用于执行敏感信息预分类的方法和系统,以及相关联的装置和介质。本申请的方案能够对数据中的敏感信息进行准确地预分类,从而有利于选择更适用的敏感信息识别算法或脱敏算法。
-
-
-
-