-
公开(公告)号:CN112035881A
公开(公告)日:2020-12-04
申请号:CN202011208957.7
申请日:2020-11-03
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F21/62
Abstract: 本说明书实施例公开了一种基于隐私保护的应用程序识别方法、装置及设备,该方法包括:获取用户访问目标应用程序的过程中产生的行为序列数据和所述目标应用程序的程序标识,所述目标应用程序为搭载在宿主程序中的小程序;对所述目标应用程序的程序标识进行差分隐私处理,得到处理后的所述程序标识;将所述处理后的所述程序标识和所述程序标识对应的所述行为序列数据发送给服务器,以使所述服务器对所述处理后的所述程序标识进行聚合还原处理,并基于还原后的所述程序标识对应的行为序列数据,确定所述目标应用程序是否为存在不合规内容的风险应用程序。
-
公开(公告)号:CN111461225A
公开(公告)日:2020-07-28
申请号:CN202010252223.2
申请日:2020-04-01
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本申请公开了一种聚类系统及其方法,该聚类系统包括:样本特征层,用于获得样本的特征向量;编码层,使用包含注意力机制的神经网络模型实现,用于对所述样本的特征向量进行编码;相似度计算层,用于根据所述编码层输出的所述样本的特征向量的编码计算各样本两两之间的相似度;聚类划分层,用于根据所述各样本两两之间的相似度进行聚类划分,其中将相似度大于预定阈值的两个样本归于一类。
-
公开(公告)号:CN111340506A
公开(公告)日:2020-06-26
申请号:CN202010439808.5
申请日:2020-05-22
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供了一种交易行为的风险识别方法、装置、存储介质和计算机设备。该方法包括:获取用户账户的多个交易行为数据;对所述多个交易行为数据进行预处理,生成多个交易行为序列;根据所述多个交易行为序列,利用行为序列分类模型,确定出交易行为分类标签;根据所述交易行为分类标签,生成所述多个交易行为数据的风险识别结果。
-
公开(公告)号:CN112182419B
公开(公告)日:2025-03-25
申请号:CN202010953821.2
申请日:2020-09-11
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/2321 , G06F18/2413 , G06F18/213 , G06F21/62 , G06F16/9536 , G06Q50/00
Abstract: 本说明书一个或多个实施例公开了一种基于隐私保护的社群聚类方法及装置,以解决现有的社群聚类效率低、且无法充分保护用户隐私的问题。所述方法包括:采集多个待聚类的目标社群的社群信息。根据所述社群信息,统计各所述目标社群在多个指定单位时段内的用户发言信息,得到各所述目标社群分别对应的、包含多个所述用户发言信息的用户发言信息集。对各所述目标社群分别对应的所述用户发言信息集中的所述用户发言信息进行脱敏处理,得到各所述目标社群分别对应的脱敏信息集。向网络侧发送各所述目标社群分别对应的所述脱敏信息集。所述网络侧用于根据所述脱敏信息集,确定各所述目标社群之间的距离,以及根据所述距离对各所述目标社群进行聚类。
-
公开(公告)号:CN111310456B
公开(公告)日:2023-06-20
申请号:CN202010090933.X
申请日:2020-02-13
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/284 , G06F40/295 , G06F40/30 , G06N3/048 , G06N3/0455 , G06N3/0464 , G06N3/0442 , G06N3/09 , G06N20/00 , G06Q40/04
Abstract: 本说明书实施例提供一种实体名称匹配方法、装置及设备。方案包括:获取待匹配实体名称;对待匹配实体名称进行分词,并将分词映射为向量,得到待匹配实体名称的词向量;采用基于自注意力机制的特征抽取器对每个词向量进行特征抽取,得到第一特征向量;再采用训练完成的条件随机场模型对第一特征向量进行序列标注,得到携带有域标签的第二特征向量,将第二特征向量输入到实体匹配模型中,得到匹配结果。
-
公开(公告)号:CN111461346B
公开(公告)日:2022-12-06
申请号:CN202010249020.8
申请日:2020-03-31
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N20/00 , G06F16/901
Abstract: 本说明书实施例公开了一种网络节点表征方法、装置和设备,其中,网络节点表征方法可在获取待表征的目标网络之后,基于目标网络中节点行为的发生时间和方向,构建多个节点序列,然后将所述多个节点序列作为文本输入预设自然语言处理模型,即可得到所述多个节点序列中的节点的表征向量。
-
公开(公告)号:CN112507710A
公开(公告)日:2021-03-16
申请号:CN202110161186.9
申请日:2021-02-05
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/284
Abstract: 本说明书提供一种估计差分隐私保护数据中分词频度方法、装置及电子设备,根据该方法,获取终端设备上报的、经本地差分隐私处理的各个分词信息;划分出N组分词信息,使同组的各个分词信息对应于相同的目标个数;确定各组分词信息各自对应的表示分词频度无偏估计的各组估计数据;基于所述各组估计数据,逐层生成用于记录分词频度的前缀树的各层节点。其中,在生成前缀树的第n层节点的过程中,选择部分备选n元分词作为第n层节点表示的n元分词,无需遍历由预设的词语单元构成的所有n元分词,不仅大大降低了计算量,提高了计算效率,而且基于分词的频度显著性分布信息而筛选出来的第n层节点表示的n元分词更具合理性。
-
公开(公告)号:CN112364367A
公开(公告)日:2021-02-12
申请号:CN202011359630.X
申请日:2020-11-27
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例公开了一种基于隐私保护的对象处理方法、装置及设备,该方法包括:获取用户访问的对象的对象标识和对象的内容风险信息,对对象标识进行差分隐私处理,得到处理后的对象标识,内容风险信息包括对象是否存在风险的信息和对象的访问量;将处理后的对象标识和对象的内容风险信息发送给服务器,以使服务器对处理后的对象标识进行还原处理,得到对象标识,基于对象标识和内容风险信息,确定对象中存在风险的目标对象;接收服务器发送的目标对象的对象标识,并基于目标对象的对象标识获取用户访问目标对象所产生的目标数据;对目标对象的对象标识进行差分隐私处理,并将处理后的目标对象的对象标识和目标数据发送给服务器。
-
公开(公告)号:CN112149404A
公开(公告)日:2020-12-29
申请号:CN202010987464.1
申请日:2020-09-18
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/216 , G06F40/30 , G06F21/62
Abstract: 本说明书一个或多个实施例提供了一种用户隐私数据的风险内容识别方法、装置及系统,其中,该方法应用于客户端,该方法包括:监测用户使用客户端中的目标应用所产生的用户隐私数据。利用预设语义表征模型,对上述用户隐私数据进行语义识别,得到相应的语义表征信息;其中,该预设语义表征模型是利用预设知识蒸馏方法处理后部署于客户端的语义表征模型。若上述语义表征信息包括用于表征可疑风险内容语句的第一语义特征向量,则向服务端发送该第一语义特征向量,以使服务端基于该第一语义特征向量对用户隐私数据进行风险内容识别。
-
公开(公告)号:CN111310456A
公开(公告)日:2020-06-19
申请号:CN202010090933.X
申请日:2020-02-13
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/284 , G06F40/295 , G06F40/30 , G06N3/04 , G06N3/08 , G06N20/00 , G06Q40/04
Abstract: 本说明书实施例提供一种实体名称匹配方法、装置及设备。方案包括:获取待匹配实体名称;对待匹配实体名称进行分词,并将分词映射为向量,得到待匹配实体名称的词向量;采用基于自注意力机制的特征抽取器对每个词向量进行特征抽取,得到第一特征向量;再采用训练完成的条件随机场模型对第一特征向量进行序列标注,得到携带有域标签的第二特征向量,将第二特征向量输入到实体匹配模型中,得到匹配结果。
-
-
-
-
-
-
-
-
-