-
公开(公告)号:CN118313007A
公开(公告)日:2024-07-09
申请号:CN202410547196.X
申请日:2024-04-29
Applicant: 武汉大学 , 支付宝(杭州)信息技术有限公司
IPC: G06F21/62 , G06Q40/08 , G06F40/247 , G06F40/30
Abstract: 本说明书实施例公开了一种基于隐私保护的文件处理方法、装置及设备,该方法包括:获取待脱敏的医疗理赔文件,医疗理赔文件中包括就医过程中产生的医疗文本的图像和/或就医过程中拍摄的医疗图像,医疗理赔文件中包括预设隐私项目的隐私数据,然后,基于医疗理赔文件,通过对抗大模型确定医疗理赔文件中的文本数据中包含的重要性高于预设阈值的目标词语,并在医疗理赔文件上对目标词语进行同义词替换,得到隐私保护后的医疗理赔文件,最终,基于隐私保护后的医疗理赔文件,基于语义调整模型提取隐私保护后的医疗理赔文件的内容的语义信息,并基于该语义信息对隐私保护后的医疗理赔文件的内容进行调整,得到脱敏后的医疗理赔文件。
-
公开(公告)号:CN118657985A
公开(公告)日:2024-09-17
申请号:CN202410698048.8
申请日:2024-05-31
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V10/764 , G06V10/75 , G06F16/33 , G06F21/62
Abstract: 本说明书一个或多个实施例公开了一种图像的处理方法、装置及电子设备。该方法首先对待处理的结构化图像进行预分类,确定结构化图像的类别,其次根据结构化图像的类别,对结构化图像进行文本信息提取处理,获取结构化图像中的文本信息以及文本信息所在的位置的信息,然后基于结构化图像中的文本信息所在的位置的信息,对结构化图像中的结构化数据进行结构化还原处理,获取结构化图像中的结构化数据的数据分布结构,最后基于结构化图像中的文本信息、结构化图像中的文本信息所在的位置的信息和结构化图像中的结构化数据的数据分布结构的位置信息,确定与文本信息对应的数据分布结构,并将文本信息填充至文本信息对应的数据分布结构中。
-
公开(公告)号:CN118608390A
公开(公告)日:2024-09-06
申请号:CN202410545154.2
申请日:2024-04-30
Applicant: 武汉大学 , 支付宝(杭州)信息技术有限公司
Abstract: 本说明书提供了一种图像脱敏方法、装置、存储介质及电子设备,通过对识别特征点后的待处理图像进行多次尺度和/或旋转变换,得到多张卷积图像,再通过对卷积图像中的各特征点对应的特征区域按照一定的方向进行旋转,得到多张旋转图像,最后将各尺度的旋转图像进行融合,得到尺度和旋转都具有不变性的包含特征点的图片,然后对识别出的特征点对应的隐私数据区域进行脱敏,确定脱敏图像。通过对待处理图像进行尺度变换,得到各个尺度和各个旋转角度下的图像的特征描述子,确定具有旋转不变性和尺度不变性的包含特征点的图像,使得脱敏处理后的图像仍然可以获取对应的特征信息,即在有效的保护待处理图像的隐私信息的同时,保留了图像的特征信息。
-
公开(公告)号:CN117290879A
公开(公告)日:2023-12-26
申请号:CN202311140596.0
申请日:2023-09-05
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F21/62 , G06F16/2455
Abstract: 本说明书实施例公开了一种模型特征的风险评估方法、装置及设备,该方法包括:基于目标模型对应的模型特征生成模型查询数据,并将模型查询数据输入到目标模型中,得到模型查询数据对应的预测标签信息;基于模型查询数据,确定每个模型特征对应的模型查询数据的分布信息,并基于该分布信息对每个模型特征对应的模型查询数据进行分组,得到每个模型特征对应的一个或多个不同的数据分组;获取每个数据分组对应的模型特征与相应的预测标签信息之间的相关系数,并基于获取的相关系数,确定每个模型特征对应的风险信息,该风险信息用于表征模型特征是否存在泄露风险;基于每个模型特征对应的风险信息,确定目标模型对应的模型特征的风险评估结果。
-
公开(公告)号:CN116049687A
公开(公告)日:2023-05-02
申请号:CN202211725080.8
申请日:2022-12-30
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供了一种数据处理方法、装置及设备,其中,该方法包括:获取待检测的目标数据,并基于所述目标数据构建语法树;基于所述语法树以及所述目标数据中每个符号所在的作用域之间的关系,确定所述目标数据中每个符号对应的目标信息,所述目标信息包括所述每个符号所在作用域的访问路径;基于所述目标数据中每个符号对应的目标信息,确定所述目标数据中任意两个符号之间的目标距离,并基于所述目标距离,对所述目标数据中的任意两个符号进行配对处理,得到配对成功的符号对;基于与所述符号对中的符号对应的有效性验证方式,对所述符号对中的符号进行有效性验证。
-
公开(公告)号:CN115115844A
公开(公告)日:2022-09-27
申请号:CN202210747045.X
申请日:2022-06-28
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供了一种评估图像特征提取算法的方法和装置。该方法的一具体实施方式包括:通过目标接口调用待评估的图像特征提取算法,对原始图像进行特征提取,得到所述原始图像对应的特征向量;将所述原始图像对应的特征向量输入预先训练的图像还原模型,得到还原图像,其中,所述图像还原模型用于根据图像的特征向量还原出图像;基于所述还原图像与所述原始图像之间的差异,评估所述图像特征提取算法的隐私保护能力。
-
公开(公告)号:CN118194299A
公开(公告)日:2024-06-14
申请号:CN202410384550.1
申请日:2024-03-29
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F21/57
Abstract: 本说明书公开了一种模型风险检测的方法、装置、存储介质及电子设备,所述方法包括:确定待检测模型,以及确定使用待检测模型的调用方。再根据调用方的类型,确定待检测模型对应的检测策略。根据检测策略,对待检测模型进行风险检测,得到待检测模型的初始结果,并确定对待检测模型进行风险检测所需的计算成本。根据初始结果和计算成本,确定待检测模型的检测结果。通过确定待检测模型的模型隐私泄露的可能性以及对待检测模型进行风险检测所需的计算成本,并根据初始结果和计算成本,可以更好地确定待检测模型的模型隐私是否泄漏,提高待检测模型的检测结果的准确性,以保证待检测模型的安全。
-
公开(公告)号:CN118315030A
公开(公告)日:2024-07-09
申请号:CN202410534441.3
申请日:2024-04-29
Applicant: 武汉大学 , 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例公开了一种基于隐私保护的医疗图像处理方法、装置及设备,该方法包括:获取待处理的医疗图像数据;对医疗图像数据进行特征提取,得到医疗图像数据对应的图像特征,并基于医疗图像数据中预设的图像关键点所在的区域对应的图像特征,通过非刚性变换模型对医疗图像数据中存在的图像显示异常进行校正,得到校正后的医疗图像数据;获取校正后的医疗图像数据中包含文本信息的图像区域,并对图像区域中的文本信息进行增强处理,得到增强后的医疗图像数据;将增强后的医疗图像数据对应的图像特征输入到脱敏模型中,得到脱敏后的医疗图像数据,并对脱敏后的医疗图像数据进行隐私数据剥离验证,以在验证通过时输出脱敏后的医疗图像数据。
-
公开(公告)号:CN115993972A
公开(公告)日:2023-04-21
申请号:CN202211401061.X
申请日:2022-11-09
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本发明涉及一种敏感信息识别方法、系统、可读存储介质及计算设备,方法包括步骤:获取待识别代码;确定待识别代码的语言类型;对待识别代码进行语法树变换,生成待识别代码对应的语法树;提取待识别代码中与字面量相关的符号表,并确定其中的变量、函数、类、常量和注释之间的关系;采用预设的数据结构表征变量、函数、类、常量和注释之间的关系,其中,针对不同的待识别代码预设的数据结构相同;针对每个字面量,确定该字面量在待识别代码中的使用场景,并得到其在使用场景中的相关信息;识别该字面量是否为敏感信息。本发明的敏感信息识别方法和系统,在提升敏感信息提取能力的同时,解决了多种语言类型的代码接入时开发量剧增的问题。
-
-
-
-
-
-
-
-