-
公开(公告)号:CN112182419A
公开(公告)日:2021-01-05
申请号:CN202010953821.2
申请日:2020-09-11
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/9536 , G06F21/62 , G06K9/62 , G06Q50/00
Abstract: 本说明书一个或多个实施例公开了一种基于隐私保护的社群聚类方法及装置,以解决现有的社群聚类效率低、且无法充分保护用户隐私的问题。所述方法包括:采集多个待聚类的目标社群的社群信息。根据所述社群信息,统计各所述目标社群在多个指定单位时段内的用户发言信息,得到各所述目标社群分别对应的、包含多个所述用户发言信息的用户发言信息集。对各所述目标社群分别对应的所述用户发言信息集中的所述用户发言信息进行脱敏处理,得到各所述目标社群分别对应的脱敏信息集。向网络侧发送各所述目标社群分别对应的所述脱敏信息集。所述网络侧用于根据所述脱敏信息集,确定各所述目标社群之间的距离,以及根据所述距离对各所述目标社群进行聚类。
-
公开(公告)号:CN112182419B
公开(公告)日:2025-03-25
申请号:CN202010953821.2
申请日:2020-09-11
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/2321 , G06F18/2413 , G06F18/213 , G06F21/62 , G06F16/9536 , G06Q50/00
Abstract: 本说明书一个或多个实施例公开了一种基于隐私保护的社群聚类方法及装置,以解决现有的社群聚类效率低、且无法充分保护用户隐私的问题。所述方法包括:采集多个待聚类的目标社群的社群信息。根据所述社群信息,统计各所述目标社群在多个指定单位时段内的用户发言信息,得到各所述目标社群分别对应的、包含多个所述用户发言信息的用户发言信息集。对各所述目标社群分别对应的所述用户发言信息集中的所述用户发言信息进行脱敏处理,得到各所述目标社群分别对应的脱敏信息集。向网络侧发送各所述目标社群分别对应的所述脱敏信息集。所述网络侧用于根据所述脱敏信息集,确定各所述目标社群之间的距离,以及根据所述距离对各所述目标社群进行聚类。
-
公开(公告)号:CN118916871A
公开(公告)日:2024-11-08
申请号:CN202410986596.0
申请日:2024-07-19
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F21/55 , G06N20/00 , G06F40/30 , G06F40/205
Abstract: 本说明书一个或多个实施例公开了一种风险防御方法及装置,该方法首先拦截用户输入目标大模型的目标内容信息,并对目标内容信息进行内容拆解处理,得到目标内容信息的风险参数,风险参数用于判断目标内容信息是否对目标大模型构成预设风险,风险参数包括:内容元素对应的参数、表达手段对应的参数、领域类型对应的参数以及情感类型对应的参数中的一种或多种,其次,基于风险参数和预设的风险识别规则,确定与目标内容信息相匹配的风险信息,最后基于所确定的风险信息,通过目标大模型对目标内容信息进行响应。
-
公开(公告)号:CN112507710A
公开(公告)日:2021-03-16
申请号:CN202110161186.9
申请日:2021-02-05
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/284
Abstract: 本说明书提供一种估计差分隐私保护数据中分词频度方法、装置及电子设备,根据该方法,获取终端设备上报的、经本地差分隐私处理的各个分词信息;划分出N组分词信息,使同组的各个分词信息对应于相同的目标个数;确定各组分词信息各自对应的表示分词频度无偏估计的各组估计数据;基于所述各组估计数据,逐层生成用于记录分词频度的前缀树的各层节点。其中,在生成前缀树的第n层节点的过程中,选择部分备选n元分词作为第n层节点表示的n元分词,无需遍历由预设的词语单元构成的所有n元分词,不仅大大降低了计算量,提高了计算效率,而且基于分词的频度显著性分布信息而筛选出来的第n层节点表示的n元分词更具合理性。
-
公开(公告)号:CN119204099A
公开(公告)日:2024-12-27
申请号:CN202411215609.0
申请日:2024-08-30
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例公开了一种数据处理方法、装置及设备,该方法包括:接收用户输入的问题数据;将所述问题数据输入到预先训练的领域模型中,得到所述问题数据所属的针对内容安全风险的目标领域;如果所述目标领域属于预设领域集合中的领域,则获取所述目标领域对应的知识数据库,并从所述目标领域对应的知识数据库中检索与所述问题数据相匹配的配置问题数据;如果从所述目标领域对应的知识数据库中检索到与所述问题数据相匹配的配置问题数据,则将所述目标领域对应的知识数据库中记载的所述配置问题数据对应的配置答案数据作为所述问题数据的答案数据,并输出所述答案数据。
-
公开(公告)号:CN112507710B
公开(公告)日:2021-05-25
申请号:CN202110161186.9
申请日:2021-02-05
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/284
Abstract: 本说明书提供一种估计差分隐私保护数据中分词频度方法、装置及电子设备,根据该方法,获取终端设备上报的、经本地差分隐私处理的各个分词信息;划分出N组分词信息,使同组的各个分词信息对应于相同的目标个数;确定各组分词信息各自对应的表示分词频度无偏估计的各组估计数据;基于所述各组估计数据,逐层生成用于记录分词频度的前缀树的各层节点。其中,在生成前缀树的第n层节点的过程中,选择部分备选n元分词作为第n层节点表示的n元分词,无需遍历由预设的词语单元构成的所有n元分词,不仅大大降低了计算量,提高了计算效率,而且基于分词的频度显著性分布信息而筛选出来的第n层节点表示的n元分词更具合理性。
-
-
-
-
-