防止隐私数据泄漏的编码模型训练方法及装置

    公开(公告)号:CN111046422B

    公开(公告)日:2021-03-12

    申请号:CN201911252327.7

    申请日:2019-12-09

    Inventor: 石磊磊 熊涛

    Abstract: 本说明书实施例提供一种编码模型训练方法,该方法包括:首先,获取多个训练样本,其中每个训练样本包括表征对应目标对象身份信息的隐私数据和对象标识;然后,将多个训练样本分别输入编码模型中,得到多个特征向量;接着,将多个特征向量分别输入用于确定目标对象身份的分类模型、用于反推隐私数据的解码模型和用于区分不同目标对象的区分模型,以对应确定分类损失、解码损失和区分损失;再然后,以最大化分类损失和解码损失,以及最小化区分损失为目标,对编码模型调参。此外,还披露一种目标对象身份识别方法,利用训练好的编码模型对采集的隐私数据进行编码,并对得到的特征向量进行传输、存储和比对使用。如此,可以有效防止隐私数据的泄漏。

    一种基于对抗学习的模型训练、图片输出方法及装置

    公开(公告)号:CN111160357B

    公开(公告)日:2020-06-30

    申请号:CN202010254884.9

    申请日:2020-04-02

    Inventor: 刘杰 石磊磊 熊涛

    Abstract: 公开了一种基于对抗学习的模型训练、图片输出方法及装置。基于对抗学习的思想,训练图片修改模型,使得经过图片修改模型修改后的图片既和原图片足够相似(如此,修改后的图片尽可能少的修饰原图片的信息,尤其是原图片包含的文字内容),又可以使得OCR模型从修改后的图片中提取出的文字内容与原始图片中的文字内容差别较大。如此,对于经过图片修改模型修改后的图片,一方面不会影响图片的正常使用,另一方面又对OCR模型文字识别的结果造成很大的干扰,保护图片中的文字内容隐私。

Patent Agency Ranking