一种基于GAN的用户人格隐私保护方法

    公开(公告)号:CN113742772A

    公开(公告)日:2021-12-03

    申请号:CN202110927352.1

    申请日:2021-08-09

    Abstract: 一种基于GAN的用户人格隐私保护方法属于社会工程学领域。本发明使用结合强化学习的生成式对抗网络来进行文本的转换,其中策略梯度来解决GAN对于文本离散性的不可导问题。我们将鉴别器中的隐层语义特征“泄露”给生成器类提高生成文本语义相似性,同时在GAN的原始目标上加入真实文本和生成文本特征向量间的语义相似度和人格差异得分,因此鉴别器的样本分类器得分J(Gθ)、语义相似性得分Jsem和人格差异性得分Jpers的加权平均值来作为反馈信号来指导生成器的学习,从而使得生成器产生高度多样化的句子以匹配真实句子的变化,避免生成模式单一的文本数据。攻击者无法从变换后的文本数据中分析出用户真实的人格,从而达到攻击效果降低或者阻断攻击的目的。

    一种基于变分自编码和K近邻组合的社交机器人检测方法

    公开(公告)号:CN113158076A

    公开(公告)日:2021-07-23

    申请号:CN202110364341.7

    申请日:2021-04-05

    Abstract: 一种基于变分自编码和K近邻组合的社交机器人检测方法属于异常检测技术领域,本发明通过网络获取社交机器人公开数据,并通过预处理提取特征,通过采用数据进行训练,再使用变分自编码进行编码以及解码,正常样本特征经过解码与初始特征更为相似,而异常样本与初始特征差异大,将原始特征与解码后的特征进行融合,再利用异常检测方法K近邻进行异常检测。该方法考虑在社交网络大环境中,异常用户群体相对于正常用户群体其数量较少,因此在数据的收集过程中,异常用户的收集相对麻烦。本发明提出的方法解决了社交机器人检测现有方法中高成本打标签和正负样本不均衡的缺点,通过减少异常样本参与模型的训练,实现社交网络机器用户的高效检测。

    一种基于GAN的用户人格隐私保护方法

    公开(公告)号:CN113742772B

    公开(公告)日:2024-10-22

    申请号:CN202110927352.1

    申请日:2021-08-09

    Abstract: 一种基于GAN的用户人格隐私保护方法属于社会工程学领域。本发明使用结合强化学习的生成式对抗网络来进行文本的转换,其中策略梯度来解决GAN对于文本离散性的不可导问题。我们将鉴别器中的隐层语义特征“泄露”给生成器类提高生成文本语义相似性,同时在GAN的原始目标上加入真实文本和生成文本特征向量间的语义相似度和人格差异得分,因此鉴别器的样本分类器得分J(Gθ)、语义相似性得分Jsem和人格差异性得分Jpers的加权平均值来作为反馈信号来指导生成器的学习,从而使得生成器产生高度多样化的句子以匹配真实句子的变化,避免生成模式单一的文本数据。攻击者无法从变换后的文本数据中分析出用户真实的人格,从而达到攻击效果降低或者阻断攻击的目的。

    一种基于变分自编码和K近邻组合的社交机器人检测方法

    公开(公告)号:CN113158076B

    公开(公告)日:2022-07-22

    申请号:CN202110364341.7

    申请日:2021-04-05

    Abstract: 一种基于变分自编码和K近邻组合的社交机器人检测方法属于异常检测技术领域,本发明通过网络获取社交机器人公开数据,并通过预处理提取特征,通过采用数据进行训练,再使用变分自编码进行编码以及解码,正常样本特征经过解码与初始特征更为相似,而异常样本与初始特征差异大,将原始特征与解码后的特征进行融合,再利用异常检测方法K近邻进行异常检测。该方法考虑在社交网络大环境中,异常用户群体相对于正常用户群体其数量较少,因此在数据的收集过程中,异常用户的收集相对麻烦。本发明提出的方法解决了社交机器人检测现有方法中高成本打标签和正负样本不均衡的缺点,通过减少异常样本参与模型的训练,实现社交网络机器用户的高效检测。

    一种基于黑盒对抗样本的社交文本人格隐私保护方法

    公开(公告)号:CN113869062A

    公开(公告)日:2021-12-31

    申请号:CN202111164828.7

    申请日:2021-09-30

    Abstract: 一种基于黑盒对抗样本的社交文本人格隐私保护方法属于社会工程学领域。本发明主要利用自然语言处理技术,使用Bert预处理模型和注意力机制为主的方法进行社交文本对抗样本的生成。通过使用Bert模型对文本进行预处理,并去除掉停用词,再通过注意力机制self‑attention寻找对每个文本中对语义贡献度大的单词进行词级替换操作,同时利用Bert模型自身生成的向量进行单词对标签贡献度的估算,选出对标签贡献度大的单词进行字符级替换操作。本发明通过同时对句子语义和标签生成两个方面进行量化,既保证了对抗样本与原文本的语义相似度,同时也保证了更大程度的造成已有分类器的误判。

Patent Agency Ranking