-
公开(公告)号:CN113869062B
公开(公告)日:2024-08-09
申请号:CN202111164828.7
申请日:2021-09-30
IPC: G06F21/62 , G06F40/30 , G06F40/284 , G06F40/211 , G06F18/22 , G06F18/241 , G06N3/0455 , G06N3/08
Abstract: 一种基于黑盒对抗样本的社交文本人格隐私保护方法属于社会工程学领域。本发明主要利用自然语言处理技术,使用Bert预处理模型和注意力机制为主的方法进行社交文本对抗样本的生成。通过使用Bert模型对文本进行预处理,并去除掉停用词,再通过注意力机制self‑attention寻找对每个文本中对语义贡献度大的单词进行词级替换操作,同时利用Bert模型自身生成的向量进行单词对标签贡献度的估算,选出对标签贡献度大的单词进行字符级替换操作。本发明通过同时对句子语义和标签生成两个方面进行量化,既保证了对抗样本与原文本的语义相似度,同时也保证了更大程度的造成已有分类器的误判。
-
公开(公告)号:CN113742772A
公开(公告)日:2021-12-03
申请号:CN202110927352.1
申请日:2021-08-09
Abstract: 一种基于GAN的用户人格隐私保护方法属于社会工程学领域。本发明使用结合强化学习的生成式对抗网络来进行文本的转换,其中策略梯度来解决GAN对于文本离散性的不可导问题。我们将鉴别器中的隐层语义特征“泄露”给生成器类提高生成文本语义相似性,同时在GAN的原始目标上加入真实文本和生成文本特征向量间的语义相似度和人格差异得分,因此鉴别器的样本分类器得分J(Gθ)、语义相似性得分Jsem和人格差异性得分Jpers的加权平均值来作为反馈信号来指导生成器的学习,从而使得生成器产生高度多样化的句子以匹配真实句子的变化,避免生成模式单一的文本数据。攻击者无法从变换后的文本数据中分析出用户真实的人格,从而达到攻击效果降低或者阻断攻击的目的。
-
公开(公告)号:CN113158076A
公开(公告)日:2021-07-23
申请号:CN202110364341.7
申请日:2021-04-05
Abstract: 一种基于变分自编码和K近邻组合的社交机器人检测方法属于异常检测技术领域,本发明通过网络获取社交机器人公开数据,并通过预处理提取特征,通过采用数据进行训练,再使用变分自编码进行编码以及解码,正常样本特征经过解码与初始特征更为相似,而异常样本与初始特征差异大,将原始特征与解码后的特征进行融合,再利用异常检测方法K近邻进行异常检测。该方法考虑在社交网络大环境中,异常用户群体相对于正常用户群体其数量较少,因此在数据的收集过程中,异常用户的收集相对麻烦。本发明提出的方法解决了社交机器人检测现有方法中高成本打标签和正负样本不均衡的缺点,通过减少异常样本参与模型的训练,实现社交网络机器用户的高效检测。
-
公开(公告)号:CN113722685B
公开(公告)日:2024-12-17
申请号:CN202110909431.X
申请日:2021-08-09
IPC: G06F21/31 , G06F18/2411 , G06N3/0442
Abstract: 一种基于击键动力学与鼠标动力学的多场景主体识别方法属于生物识别领域。本发明通过日常电脑的几个特殊场景建模出可以在自由场景中对用户进行识别的模型,建模阶段可以让用户进行基于几个特定场景的数据收集后进行自有场景建模,这样即克服了单场景建模带来的局限性,又克服了自由场景建模所需的长时间数据收集过程。
-
公开(公告)号:CN113742772B
公开(公告)日:2024-10-22
申请号:CN202110927352.1
申请日:2021-08-09
Abstract: 一种基于GAN的用户人格隐私保护方法属于社会工程学领域。本发明使用结合强化学习的生成式对抗网络来进行文本的转换,其中策略梯度来解决GAN对于文本离散性的不可导问题。我们将鉴别器中的隐层语义特征“泄露”给生成器类提高生成文本语义相似性,同时在GAN的原始目标上加入真实文本和生成文本特征向量间的语义相似度和人格差异得分,因此鉴别器的样本分类器得分J(Gθ)、语义相似性得分Jsem和人格差异性得分Jpers的加权平均值来作为反馈信号来指导生成器的学习,从而使得生成器产生高度多样化的句子以匹配真实句子的变化,避免生成模式单一的文本数据。攻击者无法从变换后的文本数据中分析出用户真实的人格,从而达到攻击效果降低或者阻断攻击的目的。
-
公开(公告)号:CN113158076B
公开(公告)日:2022-07-22
申请号:CN202110364341.7
申请日:2021-04-05
Abstract: 一种基于变分自编码和K近邻组合的社交机器人检测方法属于异常检测技术领域,本发明通过网络获取社交机器人公开数据,并通过预处理提取特征,通过采用数据进行训练,再使用变分自编码进行编码以及解码,正常样本特征经过解码与初始特征更为相似,而异常样本与初始特征差异大,将原始特征与解码后的特征进行融合,再利用异常检测方法K近邻进行异常检测。该方法考虑在社交网络大环境中,异常用户群体相对于正常用户群体其数量较少,因此在数据的收集过程中,异常用户的收集相对麻烦。本发明提出的方法解决了社交机器人检测现有方法中高成本打标签和正负样本不均衡的缺点,通过减少异常样本参与模型的训练,实现社交网络机器用户的高效检测。
-
公开(公告)号:CN113869062A
公开(公告)日:2021-12-31
申请号:CN202111164828.7
申请日:2021-09-30
IPC: G06F40/30 , G06F40/284 , G06F40/211 , G06F21/62 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 一种基于黑盒对抗样本的社交文本人格隐私保护方法属于社会工程学领域。本发明主要利用自然语言处理技术,使用Bert预处理模型和注意力机制为主的方法进行社交文本对抗样本的生成。通过使用Bert模型对文本进行预处理,并去除掉停用词,再通过注意力机制self‑attention寻找对每个文本中对语义贡献度大的单词进行词级替换操作,同时利用Bert模型自身生成的向量进行单词对标签贡献度的估算,选出对标签贡献度大的单词进行字符级替换操作。本发明通过同时对句子语义和标签生成两个方面进行量化,既保证了对抗样本与原文本的语义相似度,同时也保证了更大程度的造成已有分类器的误判。
-
公开(公告)号:CN112364638A
公开(公告)日:2021-02-12
申请号:CN202011099735.6
申请日:2020-10-13
IPC: G06F40/284 , G06N3/04 , G06N3/08
Abstract: 一种基于社交文本的人格识别方法属于自然语言处理领域。本发明将获取的社交文本数据利用词嵌入模型表示为词向量,以此作为卷积神经网络(conv olutional neural network,CNN)和长短期记忆网络(long short‑term memory,LSTM)的输入,同时将原始词向量特征、CNN和LSTM的输出特征融合,并利用注意力机制(attention mechanism)对融合特征筛选出更关键的特征,最终实现基于大五人格模型的社交网络用户人格分类。
-
公开(公告)号:CN112364638B
公开(公告)日:2022-08-30
申请号:CN202011099735.6
申请日:2020-10-13
IPC: G06F40/284 , G06N3/04 , G06N3/08
Abstract: 一种基于社交文本的人格识别方法属于自然语言处理领域。本发明将获取的社交文本数据利用词嵌入模型表示为词向量,以此作为卷积神经网络(conv olutional neural network,CNN)和长短期记忆网络(long short‑term memory,LSTM)的输入,同时将原始词向量特征、CNN和LSTM的输出特征融合,并利用注意力机制(attention mechanism)对融合特征筛选出更关键的特征,最终实现基于大五人格模型的社交网络用户人格分类。
-
公开(公告)号:CN113722685A
公开(公告)日:2021-11-30
申请号:CN202110909431.X
申请日:2021-08-09
Abstract: 一种基于击键动力学与鼠标动力学的多场景主体识别方法属于生物识别领域。本发明通过日常电脑的几个特殊场景建模出可以在自由场景中对用户进行识别的模型,建模阶段可以让用户进行基于几个特定场景的数据收集后进行自有场景建模,这样即克服了单场景建模带来的局限性,又克服了自由场景建模所需的长时间数据收集过程。
-
-
-
-
-
-
-
-
-