基于隐私保护的社群聚类方法及装置

    公开(公告)号:CN112182419A

    公开(公告)日:2021-01-05

    申请号:CN202010953821.2

    申请日:2020-09-11

    Abstract: 本说明书一个或多个实施例公开了一种基于隐私保护的社群聚类方法及装置,以解决现有的社群聚类效率低、且无法充分保护用户隐私的问题。所述方法包括:采集多个待聚类的目标社群的社群信息。根据所述社群信息,统计各所述目标社群在多个指定单位时段内的用户发言信息,得到各所述目标社群分别对应的、包含多个所述用户发言信息的用户发言信息集。对各所述目标社群分别对应的所述用户发言信息集中的所述用户发言信息进行脱敏处理,得到各所述目标社群分别对应的脱敏信息集。向网络侧发送各所述目标社群分别对应的所述脱敏信息集。所述网络侧用于根据所述脱敏信息集,确定各所述目标社群之间的距离,以及根据所述距离对各所述目标社群进行聚类。

    一种用户社群的评价方法、装置及设备

    公开(公告)号:CN111782813A

    公开(公告)日:2020-10-16

    申请号:CN202010647688.8

    申请日:2020-07-07

    Abstract: 本说明书实施例公开了一种用户社群的评价方法、装置及设备,该方法包括获取多个不同用户对商户的评论信息;基于所述多个不同用户对商户的评论信息,构建用户与商户之间的二部图,其中,所述二部图中的节点基于用户和商户确定,所述二部图中的边线基于用户对商户的评论信息确定;基于所述多个不同用户的信息、相应商户的信息和所述用户与商户之间的二部图进行图嵌入Graph Embedding处理,得到所述多个不同用户的嵌入Embedding特征;基于所述多个不同用户的Embedding特征,对所述多个不同用户进行聚类,得到分簇的用户社群;针对每个所述分簇的用户社群,基于所述分簇的用户社群中用户对商户的评论信息,确定所述分簇的用户社群是否为恶意评论社群。

    一种用户社群的评价方法、装置及设备

    公开(公告)号:CN111782813B

    公开(公告)日:2023-10-31

    申请号:CN202010647688.8

    申请日:2020-07-07

    Abstract: 本说明书实施例公开了一种用户社群的评价方法、装置及设备,该方法包括获取多个不同用户对商户的评论信息;基于所述多个不同用户对商户的评论信息,构建用户与商户之间的二部图,其中,所述二部图中的节点基于用户和商户确定,所述二部图中的边线基于用户对商户的评论信息确定;基于所述多个不同用户的信息、相应商户的信息和所述用户与商户之间的二部图进行图嵌入Graph Embedding处理,得到所述多个不同用户的嵌入Embedding特征;基于所述多个不同用户的Embedding特征,对所述多个不同用户进行聚类,得到分簇的用户社群;针对每个所述分簇的用户社群,基于所述分簇的用户社群中用户对商户的评论信息,确定所述分簇的用户社群是否为恶意评论社群。

    基于隐私保护的风险识别方法及装置

    公开(公告)号:CN112149179B

    公开(公告)日:2022-09-02

    申请号:CN202010986615.1

    申请日:2020-09-18

    Abstract: 本说明书一个或多个实施例公开了一种基于隐私保护的风险识别方法及装置,以解决现有的利用终端边缘计算能力进行风险防控效果不佳、且局限性较大的问题。所述方法包括:获取目标小程序的运行过程中所产生的第一文本数据。利用预先部署于所述客户端的语义表征模型,对所述第一文本数据进行语义识别,得到所述第一文本数据对应的语义表征向量。其中,所述语义表征模型基于预设语料库训练、并利用预设知识蒸馏方法处理后得到。所述预设语料库包括具有风险内容的第一类样本语料和不具有风险内容的第二类样本语料。根据所述语义表征向量对所述第一文本数据进行风险识别,得到所述第一文本数据对应的风险识别结果。

    客户聚类系统及其方法
    5.
    发明授权

    公开(公告)号:CN111461225B

    公开(公告)日:2022-04-01

    申请号:CN202010252223.2

    申请日:2020-04-01

    Inventor: 李怀松 陈永环

    Abstract: 本申请公开了一种聚类系统及其方法,该聚类系统包括:样本特征层,用于获得样本的特征向量;编码层,使用包含注意力机制的神经网络模型实现,用于对所述样本的特征向量进行编码;相似度计算层,用于根据所述编码层输出的所述样本的特征向量的编码计算各样本两两之间的相似度;聚类划分层,用于根据所述各样本两两之间的相似度进行聚类划分,其中将相似度大于预定阈值的两个样本归于一类。

    估计差分隐私保护数据中分词频度的方法及装置

    公开(公告)号:CN112507710B

    公开(公告)日:2021-05-25

    申请号:CN202110161186.9

    申请日:2021-02-05

    Abstract: 本说明书提供一种估计差分隐私保护数据中分词频度方法、装置及电子设备,根据该方法,获取终端设备上报的、经本地差分隐私处理的各个分词信息;划分出N组分词信息,使同组的各个分词信息对应于相同的目标个数;确定各组分词信息各自对应的表示分词频度无偏估计的各组估计数据;基于所述各组估计数据,逐层生成用于记录分词频度的前缀树的各层节点。其中,在生成前缀树的第n层节点的过程中,选择部分备选n元分词作为第n层节点表示的n元分词,无需遍历由预设的词语单元构成的所有n元分词,不仅大大降低了计算量,提高了计算效率,而且基于分词的频度显著性分布信息而筛选出来的第n层节点表示的n元分词更具合理性。

    一种基于隐私保护的应用程序识别方法、装置及设备

    公开(公告)号:CN112035881B

    公开(公告)日:2021-02-09

    申请号:CN202011208957.7

    申请日:2020-11-03

    Abstract: 本说明书实施例公开了一种基于隐私保护的应用程序识别方法、装置及设备,该方法包括:获取用户访问目标应用程序的过程中产生的行为序列数据和所述目标应用程序的程序标识,所述目标应用程序为搭载在宿主程序中的小程序;对所述目标应用程序的程序标识进行差分隐私处理,得到处理后的所述程序标识;将所述处理后的所述程序标识和所述程序标识对应的所述行为序列数据发送给服务器,以使所述服务器对所述处理后的所述程序标识进行聚合还原处理,并基于还原后的所述程序标识对应的行为序列数据,确定所述目标应用程序是否为存在不合规内容的风险应用程序。

    一种网络节点表征方法、装置和设备

    公开(公告)号:CN111461346A

    公开(公告)日:2020-07-28

    申请号:CN202010249020.8

    申请日:2020-03-31

    Inventor: 陈永环 张天翼

    Abstract: 本说明书实施例公开了一种网络节点表征方法、装置和设备,其中,网络节点表征方法可在获取待表征的目标网络之后,基于目标网络中节点行为的发生时间和方向,构建多个节点序列,然后将所述多个节点序列作为文本输入预设自然语言处理模型,即可得到所述多个节点序列中的节点的表征向量。

    一种基于隐私保护的对象处理方法、装置及设备

    公开(公告)号:CN112364367B

    公开(公告)日:2025-01-28

    申请号:CN202011359630.X

    申请日:2020-11-27

    Abstract: 本说明书实施例公开了一种基于隐私保护的对象处理方法、装置及设备,该方法包括:获取用户访问的对象的对象标识和对象的内容风险信息,对对象标识进行差分隐私处理,得到处理后的对象标识,内容风险信息包括对象是否存在风险的信息和对象的访问量;将处理后的对象标识和对象的内容风险信息发送给服务器,以使服务器对处理后的对象标识进行还原处理,得到对象标识,基于对象标识和内容风险信息,确定对象中存在风险的目标对象;接收服务器发送的目标对象的对象标识,并基于目标对象的对象标识获取用户访问目标对象所产生的目标数据;对目标对象的对象标识进行差分隐私处理,并将处理后的目标对象的对象标识和目标数据发送给服务器。

    基于隐私保护的风险识别方法及装置

    公开(公告)号:CN112149179A

    公开(公告)日:2020-12-29

    申请号:CN202010986615.1

    申请日:2020-09-18

    Abstract: 本说明书一个或多个实施例公开了一种基于隐私保护的风险识别方法及装置,以解决现有的利用终端边缘计算能力进行风险防控效果不佳、且局限性较大的问题。所述方法包括:获取目标小程序的运行过程中所产生的第一文本数据。利用预先部署于所述客户端的语义表征模型,对所述第一文本数据进行语义识别,得到所述第一文本数据对应的语义表征向量。其中,所述语义表征模型基于预设语料库训练、并利用预设知识蒸馏方法处理后得到。所述预设语料库包括具有风险内容的第一类样本语料和不具有风险内容的第二类样本语料。根据所述语义表征向量对所述第一文本数据进行风险识别,得到所述第一文本数据对应的风险识别结果。

Patent Agency Ranking