利用遗传编程的命名实体识别和提取

    公开(公告)号:CN111758098B

    公开(公告)日:2024-03-26

    申请号:CN202080001341.4

    申请日:2020-04-24

    Abstract: 本文公开了使用遗传算法生成模式程序的方法、系统和装置,包括编码在计算机存储介质上的计算机程序。遗传算法对表示将通过命名实体识别来识别或提取的数据类别的示例数据串进行操作。在初始化阶段,基于表示将通过命名实体识别来识别或提取的数据类别的示例数据串,生成初始模式程序。从初始模式程序开始,迭代地进行遗传操作以生成多代的后代模式程序。在每一轮遗传操作中,后代模式程序是通过交叉繁殖操作和变异操作生成的。

    一种应用程序的信息检测方法、装置及设备

    公开(公告)号:CN112199506B

    公开(公告)日:2021-08-24

    申请号:CN202011247122.2

    申请日:2020-11-10

    Abstract: 本说明书实施例公开了一种应用程序的信息检测方法、装置及设备,该方法包括:获取待识别应用程序的隐私政策文本;将隐私政策文本输入训练完成的识别模型中,得到所述隐私政策文本中表示的待识别应用程序需获取的第一信息;确定待识别应用程序的源码中表示的待识别应用程序需获取的第二信息;获取待识别应用程序被允许获取的标准信息;检测所述第一信息是否与所述标准信息一致,得到第一检测结果;检测所述第二信息是否与所述标准信息一致,得到第二检测结果;根据所述第一检测结果与所述第二检测结果,生成合规检测信息。

    一种隐私数据识别方法、装置、设备和可读介质

    公开(公告)号:CN111783126B

    公开(公告)日:2022-04-29

    申请号:CN202010706285.6

    申请日:2020-07-21

    Abstract: 本说明书实施例公开了一种隐私数据识别方法、装置、设备和可读介质。方案包括:获取第一数据集的第一长度分布向量和第一字符分布统计信息,所述第一数据集为隐私数据样本的集合;获取第二数据集的第二长度分布向量和第二字符分布统计信息,所述第二数据集为待识别字段对应的至少部分数据样本的集合;计算所述第一数据集与所述第二数据集的长度分布相似度、字符分布相似度,并基于所述长度分布相似度和字符分布相似度确定所述待识别字段对应的数据是否为与所述第一数据集同类型的隐私数据。

    利用遗传编程的命名实体识别和提取

    公开(公告)号:CN113366511B

    公开(公告)日:2022-03-25

    申请号:CN202080000848.8

    申请日:2020-01-07

    Abstract: 本文公开了使用遗传算法生成模式程序的方法、系统和装置,包括编码在计算机存储介质上的计算机程序。遗传算法对表示将通过命名实体识别来识别或提取的数据类别的示例数据串进行运算。在初始化阶段,基于表示将通过命名实体识别来识别或提取的数据类别的示例数据串,生成初始模式程序。从初始模式程序开始,迭代地进行遗传运算以生成多代的后代模式程序。在每一轮遗传运算中,后代模式程序是通过交叉繁殖运算和变异运算生成的。

    一种隐私数据识别系统的构建方法及装置

    公开(公告)号:CN113220949A

    公开(公告)日:2021-08-06

    申请号:CN202110517500.2

    申请日:2021-05-12

    Abstract: 本说明书公开了一种隐私数据识别系统的构建方法及装置。该方法应用于隐私识别服务平台,隐私识别服务平台配置有多个隐私识别模块集合,不同的隐私识别模块集合具有不同的识别性能;各识别模块集合整体能够识别的隐私数据类型相同、任意识别模块集合内的不同模块分别用于识别不同类型的隐私数据;所述方法包括:接收目标需求方发送的识别系统构建请求;请求中包括:对隐私数据类型的识别需求、以及对识别性能的需求;从多个隐私识别模块集合中,选择与识别性能需求相匹配的模块集合;在所选择的模块集合中,选择与隐私数据类型的识别需求相匹配的一个或多个识别模块;基于所选择的模块,构建对应于目标需求方的隐私数据识别系统。

    一种应用程序的合规检测方法、装置和电子设备

    公开(公告)号:CN112214418B

    公开(公告)日:2021-03-02

    申请号:CN202011399091.2

    申请日:2020-12-04

    Abstract: 本说明书公开了一种应用程序的合规检测方法、装置和电子设备,该方法包括:从应用程序的合规政策库中,获取与目标应用程序的功能类型相对应的合法数据项的采集权限;基于预先训练的目标二分类模型,对所述目标应用程序申明的隐私政策文本进行分类,以获取所述目标应用程序申明的隐私政策文本中存在数据项采集的候选文本;基于预先训练的指定命名实体识别模型,识别所述候选文本指示采集的数据项;基于与所述目标应用程序的功能相对应的合法数据项的采集权限、所述候选文本指示采集的数据项以及所述目标应用程序的代码指示采集的数据项,对所述目标应用程序的数据项采集权限进行合规检测。

    一种应用程序隐私合规检测方法、装置、设备和介质

    公开(公告)号:CN112257114A

    公开(公告)日:2021-01-22

    申请号:CN202011390190.4

    申请日:2020-12-02

    Abstract: 本说明书实施例公开了一种应用程序的隐私合规检测方法、装置、设备和计算机可读介质。方案可以包括:使用多标签分类模型从待识别应用程序的隐私声明文本中识别出隐私声明文本声明采集的第一隐私数据类型集合,并确定待识别应用程序的源码中表示的所述待识别应用程序采集的第二隐私数据类型集合,以及获取待识别应用程序被允许采集的标准隐私数据类型集合,然后将所述第一隐私数据类型集合、所述第二隐私数据类型集合和所述标准隐私数据类型集合三者进行对比分析,可以自动获得APP的隐私合规性检测结果。

    一种识别隐私数据的方法、装置、设备和可读介质

    公开(公告)号:CN112132238A

    公开(公告)日:2020-12-25

    申请号:CN202011322577.6

    申请日:2020-11-23

    Abstract: 本说明书实施例公开了一种识别隐私数据的方法、装置、设备和可读介质。该方法包括:获取待识别数据的元数据;将所述元数据输入第一多分类模型以对所述待识别数据的数据类型进行识别,得到第一识别结果;所述第一多分类模型是基于隐私类型数据对应的元数据进行训练得到的;若所述第一识别结果表示所述待识别数据属于隐私数据,则根据所述第一识别结果确定所述待识别数据所属的隐私类型;若所述第一识别结果表示所述待识别数据不属于隐私数据,则将所述元数据和所述待识别数据输入第二多分类模型,得到第二识别结果;根据所述第二识别结果确定所述待识别数据所属的隐私类型。

    一种隐私数据识别方法、装置、设备和可读介质

    公开(公告)号:CN111783126A

    公开(公告)日:2020-10-16

    申请号:CN202010706285.6

    申请日:2020-07-21

    Abstract: 本说明书实施例公开了一种隐私数据识别方法、装置、设备和可读介质。方案包括:获取第一数据集的第一长度分布向量和第一字符分布统计信息,所述第一数据集为隐私数据样本的集合;获取第二数据集的第二长度分布向量和第二字符分布统计信息,所述第二数据集为待识别字段对应的至少部分数据样本的集合;计算所述第一数据集与所述第二数据集的长度分布相似度、字符分布相似度,并基于所述长度分布相似度和字符分布相似度确定所述待识别字段对应的数据是否为与所述第一数据集同类型的隐私数据。

    利用遗传编程的命名实体识别和提取

    公开(公告)号:CN111758098A

    公开(公告)日:2020-10-09

    申请号:CN202080001341.4

    申请日:2020-04-24

    Abstract: 本文公开了使用遗传算法生成模式程序的方法、系统和装置,包括编码在计算机存储介质上的计算机程序。遗传算法对表示将通过命名实体识别来识别或提取的数据类别的示例数据串进行操作。在初始化阶段,基于表示将通过命名实体识别来识别或提取的数据类别的示例数据串,生成初始模式程序。从初始模式程序开始,迭代地进行遗传操作以生成多代的后代模式程序。在每一轮遗传操作中,后代模式程序是通过交叉繁殖操作和变异操作生成的。

Patent Agency Ranking