-
公开(公告)号:CN113326536A
公开(公告)日:2021-08-31
申请号:CN202110612524.6
申请日:2021-06-02
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F21/62 , G06F40/289 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本说明书实施例提供一种应用程序的合规性判别方法和装置,方法包括:获取应用程序的代码分析结果,所述代码分析结果指示出所述应用程序实际采集的隐私信息类别构成的第一类别集合;获取所述应用程序的隐私声明文本声明采集的隐私信息类别构成的第二类别集合,所述第二类别集合基于所述隐私声明文本对应的词序列分类得到;当所述第一类别集合与所述第二类别集合一致,且包括的隐私信息类别均属于法律法规中允许所述应用程序采集的隐私信息类别时,确定所述应用程序合规。能够快速有效的判别出应用程序是否合规。
-
公开(公告)号:CN111738358A
公开(公告)日:2020-10-02
申请号:CN202010722262.4
申请日:2020-07-24
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06K9/62
Abstract: 本说明书实施例公开了一种数据识别方法、装置、设备和计算机可读介质。方案包括:获取第一数据集,所述第一数据集中的数据样本为待识别字段的至少部分数据;获取基于第二数据集中的数据样本统计得到的状态转移矩阵集合,所述第二数据集中数据样本的数据类型是已知的;基于所述状态转移矩阵集合,确定所述第一数据集中各数据样本对应的样本状态转移概率;确定所述第一数据集中所述样本状态转移概率大于第一阈值的数据样本的数量相对所述第一数据集中数据样本的总数量的比例;若所述比例大于第二阈值,则将所述待识别字段对应的数据确定为与所述第二数据集中的数据样本具有相同的数据类型。
-
公开(公告)号:CN111539021A
公开(公告)日:2020-08-14
申请号:CN202010337967.4
申请日:2020-04-26
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种数据隐私类型确定方法、装置及设备。方案包括:获取待识别数据;采用多分类模型识别对待识别数据的隐私类型进行初步筛选,得到隐私类型集合;对于隐私类型集合中的每种隐私类型,确定与该种隐私类型对应的识别规则,得到识别规则集合;采用识别规则集合中的各条规则对待识别数据进行识别,得到多个识别结果;根据多个识别结果,确定待识别数据的一个目标隐私类型。
-
公开(公告)号:CN114090076A
公开(公告)日:2022-02-25
申请号:CN202111327731.3
申请日:2021-11-10
Applicant: 支付宝(杭州)信息技术有限公司 , 蚂蚁区块链科技(上海)有限公司
IPC: G06F8/77
Abstract: 本说明书实施例提供一种应用程序的合规性判别方法和装置,方法包括:获取知识图谱形式的合规知识库,其根据多部法律法规的解析结果构建,包含多个实体、实体之间的关系;实体对应于法律法规、法条或合规要点;获取目标应用程序的代码分析结果,其指示出目标应用程序实际采集的隐私信息类别构成的第一类别集合,以及使用情况信息;获取目标应用程序的隐私声明文本声明采集的隐私信息类别构成的第二类别集合,以及包含的声明信息类别;基于第一类别集合、使用情况信息、第二类别集合和声明信息类别,判断目标应用程序是否符合合规知识库中的各个合规要点,以确定目标应用程序的合规检测结果。能够高效的判别出应用程序是否合规。
-
公开(公告)号:CN112199506A
公开(公告)日:2021-01-08
申请号:CN202011247122.2
申请日:2020-11-10
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/35 , G06F40/295 , G06Q10/06 , G06Q40/02
Abstract: 本说明书实施例公开了一种应用程序的信息检测方法、装置及设备,该方法包括:获取待识别应用程序的隐私政策文本;将隐私政策文本输入训练完成的识别模型中,得到所述隐私政策文本中表示的待识别应用程序需获取的第一信息;确定待识别应用程序的源码中表示的待识别应用程序需获取的第二信息;获取待识别应用程序被允许获取的标准信息;检测所述第一信息是否与所述标准信息一致,得到第一检测结果;检测所述第二信息是否与所述标准信息一致,得到第二检测结果;根据所述第一检测结果与所述第二检测结果,生成合规检测信息。
-
公开(公告)号:CN111738358B
公开(公告)日:2020-12-08
申请号:CN202010722262.4
申请日:2020-07-24
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06K9/62
Abstract: 本说明书实施例公开了一种数据识别方法、装置、设备和计算机可读介质。方案包括:获取第一数据集,所述第一数据集中的数据样本为待识别字段的至少部分数据;获取基于第二数据集中的数据样本统计得到的状态转移矩阵集合,所述第二数据集中数据样本的数据类型是已知的;基于所述状态转移矩阵集合,确定所述第一数据集中各数据样本对应的样本状态转移概率;确定所述第一数据集中所述样本状态转移概率大于第一阈值的数据样本的数量相对所述第一数据集中数据样本的总数量的比例;若所述比例大于第二阈值,则将所述待识别字段对应的数据确定为与所述第二数据集中的数据样本具有相同的数据类型。
-
公开(公告)号:CN111709052A
公开(公告)日:2020-09-25
申请号:CN202010485005.3
申请日:2020-06-01
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F21/62
Abstract: 本说明书实施例公开了隐私数据识别和处理方法、装置、设备及计算机可读介质。方案包括:采用预先训练的命名实体识别模型,确定目标字段的多条数据中的隐私序列的位置信息和序列隐私类型信息;从而得到所述多条数据的隐私结构类型,所述隐私结构类型包括非隐私结构类型、单序列隐私结构类型和复合序列隐私结构类型;进而确定所述目标字段的隐私结构类型;然后对所述目标字段添加用于表示所述目标字段的隐私结构类型的标签,所述标签可以用于指示采用与所述标签对应的数据脱敏方式对所述目标字段的数据进行脱敏处理。
-
公开(公告)号:CN111061763B
公开(公告)日:2023-08-04
申请号:CN201911109250.8
申请日:2019-11-13
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/2455
Abstract: 本说明书的实施例提供用于生成规则引擎的规则执行计划的方法及装置。在该方法中,基于规则树中的逻辑运算关系,对规则树进行层次分析,以得到规则树的分层结构信息,所述分层结构信息包括每层分层结构的逻辑组成关系以及各层分层结构的层级关系;确定各个规则单元的执行开销;基于各个规则单元的执行开销以及规则树的分层结构信息,确定各个规则单元的执行顺序;以及根据所确定出的各个规则单元的执行顺序,生成规则的规则执行计划。
-
公开(公告)号:CN111783126B
公开(公告)日:2022-04-29
申请号:CN202010706285.6
申请日:2020-07-21
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F21/60 , G06F21/62 , G06F16/903 , G06K9/62
Abstract: 本说明书实施例公开了一种隐私数据识别方法、装置、设备和可读介质。方案包括:获取第一数据集的第一长度分布向量和第一字符分布统计信息,所述第一数据集为隐私数据样本的集合;获取第二数据集的第二长度分布向量和第二字符分布统计信息,所述第二数据集为待识别字段对应的至少部分数据样本的集合;计算所述第一数据集与所述第二数据集的长度分布相似度、字符分布相似度,并基于所述长度分布相似度和字符分布相似度确定所述待识别字段对应的数据是否为与所述第一数据集同类型的隐私数据。
-
公开(公告)号:CN113366511B
公开(公告)日:2022-03-25
申请号:CN202080000848.8
申请日:2020-01-07
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N3/12
Abstract: 本文公开了使用遗传算法生成模式程序的方法、系统和装置,包括编码在计算机存储介质上的计算机程序。遗传算法对表示将通过命名实体识别来识别或提取的数据类别的示例数据串进行运算。在初始化阶段,基于表示将通过命名实体识别来识别或提取的数据类别的示例数据串,生成初始模式程序。从初始模式程序开始,迭代地进行遗传运算以生成多代的后代模式程序。在每一轮遗传运算中,后代模式程序是通过交叉繁殖运算和变异运算生成的。
-
-
-
-
-
-
-
-
-