保护用户隐私的风险检测方法和装置

    公开(公告)号:CN111405563B

    公开(公告)日:2021-07-13

    申请号:CN202010213835.0

    申请日:2020-03-24

    Inventor: 石磊磊 熊涛

    Abstract: 本说明书实施例提供一种保护用户隐私的风险检测方法和装置,方法包括:第一终端设备根据与其对应的第一用户的关联信息,确定第一子图,第一子图包括中心节点和中心节点的关联节点,中心节点对应第一用户,关联节点对应与第一用户具有关联关系的第二用户;第一终端设备向服务器发送第一子图,以使服务器根据第一子图更新全局图,并根据更新后的全局图确定第一子图的图嵌入信息,图嵌入信息至少包括第一子图中各节点分别对应的节点特征向量;全局图根据多个终端设备发送的子图而建立;第一终端设备从服务器接收图嵌入信息;第一终端设备根据图嵌入信息,确定第一子图对应的风险评估结果,用于进行风险决策。能够有效的保护用户隐私。

    估计差分隐私保护数据中分词频度的方法及装置

    公开(公告)号:CN112507710A

    公开(公告)日:2021-03-16

    申请号:CN202110161186.9

    申请日:2021-02-05

    Abstract: 本说明书提供一种估计差分隐私保护数据中分词频度方法、装置及电子设备,根据该方法,获取终端设备上报的、经本地差分隐私处理的各个分词信息;划分出N组分词信息,使同组的各个分词信息对应于相同的目标个数;确定各组分词信息各自对应的表示分词频度无偏估计的各组估计数据;基于所述各组估计数据,逐层生成用于记录分词频度的前缀树的各层节点。其中,在生成前缀树的第n层节点的过程中,选择部分备选n元分词作为第n层节点表示的n元分词,无需遍历由预设的词语单元构成的所有n元分词,不仅大大降低了计算量,提高了计算效率,而且基于分词的频度显著性分布信息而筛选出来的第n层节点表示的n元分词更具合理性。

    保护用户隐私的风险检测方法和装置

    公开(公告)号:CN111405563A

    公开(公告)日:2020-07-10

    申请号:CN202010213835.0

    申请日:2020-03-24

    Inventor: 石磊磊 熊涛

    Abstract: 本说明书实施例提供一种保护用户隐私的风险检测方法和装置,方法包括:第一终端设备根据与其对应的第一用户的关联信息,确定第一子图,第一子图包括中心节点和中心节点的关联节点,中心节点对应第一用户,关联节点对应与第一用户具有关联关系的第二用户;第一终端设备向服务器发送第一子图,以使服务器根据第一子图更新全局图,并根据更新后的全局图确定第一子图的图嵌入信息,图嵌入信息至少包括第一子图中各节点分别对应的节点特征向量;全局图根据多个终端设备发送的子图而建立;第一终端设备从服务器接收图嵌入信息;第一终端设备根据图嵌入信息,确定第一子图对应的风险评估结果,用于进行风险决策。能够有效的保护用户隐私。

    防止隐私数据泄漏的编码模型训练方法及装置

    公开(公告)号:CN111046422A

    公开(公告)日:2020-04-21

    申请号:CN201911252327.7

    申请日:2019-12-09

    Inventor: 石磊磊 熊涛

    Abstract: 本说明书实施例提供一种编码模型训练方法,该方法包括:首先,获取多个训练样本,其中每个训练样本包括表征对应目标对象身份信息的隐私数据和对象标识;然后,将多个训练样本分别输入编码模型中,得到多个特征向量;接着,将多个特征向量分别输入用于确定目标对象身份的分类模型、用于反推隐私数据的解码模型和用于区分不同目标对象的区分模型,以对应确定分类损失、解码损失和区分损失;再然后,以最大化分类损失和解码损失,以及最小化区分损失为目标,对编码模型调参。此外,还披露一种目标对象身份识别方法,利用训练好的编码模型对采集的隐私数据进行编码,并对得到的特征向量进行传输、存储和比对使用。如此,可以有效防止隐私数据的泄漏。

    识别对抗样本以保护模型安全的方法及装置

    公开(公告)号:CN110852450B

    公开(公告)日:2020-04-14

    申请号:CN202010040234.4

    申请日:2020-01-15

    Inventor: 石磊磊 熊涛

    Abstract: 本说明书实施例提供一种识别对抗样本以保护隐私安全的方法,该方法包括:首先,对涉及隐私数据的多个非对抗样本进行采样,得到第一对照样本集;接着,向第一对照样本集中加入待检测的目标样本,得到第一实验样本集;然后,分别利用第一对照样本集和第一实验样本集对初始机器学习模型进行训练,得到训练后的第一对照模型和第一实验模型;再接着,利用测试样本集分别对第一对照模型和第一实验模型进行性能评估,得到针对预设评估指标的第一对照值和第一实验值;再然后,计算第一对照值和第一实验值的差值,作为目标样本针对模型性能的第一增益值。由此,可以基于第一增益值或重复上述流程而得到的多个增益值,判别目标样本是否为对抗样本。

    一种用户行为模式的识别方法和装置

    公开(公告)号:CN114707990B

    公开(公告)日:2023-04-07

    申请号:CN202210289732.1

    申请日:2022-03-23

    Abstract: 本说明书实施例提供了一种用户行为模式的确定方法和装置,该方法包括:获取有标签的N个用户行为序列,每个用户行为序列包括依次的多个操作行为;根据N个用户行为序列,构建行为转移关系图;行为转移关系图包括节点以及节点之间的有向边,节点对应于操作行为,有向边对应于N个用户行为序列中连续两个操作行为之间的转移关系;确定各转移关系相对于标签的信息价值;根据信息价值和转移关系图,确定在各操作行为后采取其它操作行为的Q值,Q值表示多步累积信息价值;根据Q值和转移关系图,确定从各个操作行为出发,到达各用户行为序列的最终操作行为的优化路径,其中,优化路径用于确定用户的行为模式。

    防止隐私数据泄漏的编码模型训练方法及装置

    公开(公告)号:CN113159288A

    公开(公告)日:2021-07-23

    申请号:CN202110440032.3

    申请日:2019-12-09

    Inventor: 石磊磊 熊涛

    Abstract: 本说明书实施例提供一种编码模型训练方法,该方法包括:首先,获取多个训练样本,其中每个训练样本包括表征对应目标对象身份信息的隐私数据和对象标识;然后,将多个训练样本分别输入编码模型中,得到多个特征向量;接着,将多个特征向量分别输入用于确定目标对象身份的分类模型、用于反推隐私数据的解码模型和用于区分不同目标对象的区分模型,以对应确定分类损失、解码损失和区分损失;再然后,以最大化分类损失和解码损失,以及最小化区分损失为目标,对编码模型调参。此外,还披露一种目标对象身份识别方法,利用训练好的编码模型对采集的隐私数据进行编码,并对得到的特征向量进行传输、存储和比对使用。如此,可以有效防止隐私数据的泄漏。

    估计差分隐私保护数据中分词频度的方法及装置

    公开(公告)号:CN112507710B

    公开(公告)日:2021-05-25

    申请号:CN202110161186.9

    申请日:2021-02-05

    Abstract: 本说明书提供一种估计差分隐私保护数据中分词频度方法、装置及电子设备,根据该方法,获取终端设备上报的、经本地差分隐私处理的各个分词信息;划分出N组分词信息,使同组的各个分词信息对应于相同的目标个数;确定各组分词信息各自对应的表示分词频度无偏估计的各组估计数据;基于所述各组估计数据,逐层生成用于记录分词频度的前缀树的各层节点。其中,在生成前缀树的第n层节点的过程中,选择部分备选n元分词作为第n层节点表示的n元分词,无需遍历由预设的词语单元构成的所有n元分词,不仅大大降低了计算量,提高了计算效率,而且基于分词的频度显著性分布信息而筛选出来的第n层节点表示的n元分词更具合理性。

    识别对抗样本以保护模型安全的方法及装置

    公开(公告)号:CN110852450A

    公开(公告)日:2020-02-28

    申请号:CN202010040234.4

    申请日:2020-01-15

    Inventor: 石磊磊 熊涛

    Abstract: 本说明书实施例提供一种识别对抗样本以保护隐私安全的方法,该方法包括:首先,对涉及隐私数据的多个非对抗样本进行采样,得到第一对照样本集;接着,向第一对照样本集中加入待检测的目标样本,得到第一实验样本集;然后,分别利用第一对照样本集和第一实验样本集对初始机器学习模型进行训练,得到训练后的第一对照模型和第一实验模型;再接着,利用测试样本集分别对第一对照模型和第一实验模型进行性能评估,得到针对预设评估指标的第一对照值和第一实验值;再然后,计算第一对照值和第一实验值的差值,作为目标样本针对模型性能的第一增益值。由此,可以基于第一增益值或重复上述流程而得到的多个增益值,判别目标样本是否为对抗样本。

    防止隐私数据泄漏的编码模型训练方法及装置

    公开(公告)号:CN113159288B

    公开(公告)日:2022-06-28

    申请号:CN202110440032.3

    申请日:2019-12-09

    Inventor: 石磊磊 熊涛

    Abstract: 本说明书实施例提供一种编码模型训练方法,该方法包括:首先,获取多个训练样本,其中每个训练样本包括表征对应目标对象身份信息的隐私数据和对象标识;然后,将多个训练样本分别输入编码模型中,得到多个特征向量;接着,将多个特征向量分别输入用于确定目标对象身份的分类模型、用于反推隐私数据的解码模型和用于区分不同目标对象的区分模型,以对应确定分类损失、解码损失和区分损失;再然后,以最大化分类损失和解码损失,以及最小化区分损失为目标,对编码模型调参。此外,还披露一种目标对象身份识别方法,利用训练好的编码模型对采集的隐私数据进行编码,并对得到的特征向量进行传输、存储和比对使用。如此,可以有效防止隐私数据的泄漏。

Patent Agency Ranking