-
公开(公告)号:CN111428971A
公开(公告)日:2020-07-17
申请号:CN202010147284.2
申请日:2020-03-05
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书提供了业务数据的处理方法、装置和服务器。在一个实施例中,该业务数据的处理方法,通过先获取并根据目标业务数据,以及与目标业务数据相关的多维度的关联数据,建立针对目标业务数据的关系属性数据;再利用包含有多种风险场景的关系属性数据的预设的风险场景知识库,根据上述目标业务数据的关系属性数据,确定出目标业务数据是否存在风险,以及目标业务数据所属的具体风险场景。从而能够较为准确、全面地识别出多种不同风险场景中存在风险的业务数据。
-
公开(公告)号:CN111177792B
公开(公告)日:2020-06-30
申请号:CN202010276685.8
申请日:2020-04-10
Applicant: 支付宝(杭州)信息技术有限公司
Inventor: 熊涛
Abstract: 本说明书实施例提供一种基于隐私保护确定目标业务模型的方法和装置,先对选定的复杂业务模型进行初始训练,得到初始业务模型,然后对初始业务模型进行修剪,并对修剪后的业务模型在参数重置回初始化状态的情形下进行训练,以考验修剪掉的模型参数是否自始不重要。对于得到的多个子模型,通过差分隐私的方式,从中选择目标业务模型。这样,可以获取隐私保护的压缩模型,在实现模型压缩的基础上,为模型提供隐私保护。
-
公开(公告)号:CN111259366A
公开(公告)日:2020-06-09
申请号:CN202010075467.8
申请日:2020-01-22
Applicant: 支付宝(杭州)信息技术有限公司
Inventor: 熊涛
Abstract: 本发明实施例提供了一种计算机执行的验证码识别器的训练方法和装置,其中验证码识别器包括特征提取器和分类器。特征提取器通过自监督方式进行训练,训练过程包括,首先获取无标签的验证码图像;将验证码图像划分为多个图块。利用特征提取器分别提取各个图块的特征,得到各个图块的编码向量。从多个图块中选取连续的图块序列,利用回归网络,基于图块序列中前面若干图块的编码向量,确定隐含向量,并基于该隐含向量确定序列中后续图块的预测向量。然后,基于后续图块的编码向量和预测向量,确定预测损失;根据该预测损失,训练特征提取器和回归网络。在训练好特征提取器后,基于特征提取器,利用有监督的方式训练分类器。
-
公开(公告)号:CN111159773A
公开(公告)日:2020-05-15
申请号:CN202010251495.0
申请日:2020-04-01
Applicant: 支付宝(杭州)信息技术有限公司
Inventor: 熊涛
Abstract: 本说明书实施例提供一种保护数据隐私的图片分类方法。该方法的执行主体为数据持有方,其中存储多个隐私图片和对应的多个类别标签,该方法包括:首先,针对该多个隐私图片中任意的第一隐私图片,确定与该第一隐私图片对应的多个特征值,组成第一原始特征矩阵;接着,对该第一原始特征矩阵中位于预定矩阵区域的部分特征值,进行预定变换,得到第一变换特征矩阵;然后,将得到的对应于该多个隐私图片的多个变换特征矩阵,以及该多个类别标签发送至模型训练方,以使其训练出图片分类模型,用于对待分类的目标图片进行分类。如此,可以同时实现保护隐私图片的数据隐私和防御针对图片分类模型的对抗攻击。
-
公开(公告)号:CN110852450A
公开(公告)日:2020-02-28
申请号:CN202010040234.4
申请日:2020-01-15
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种识别对抗样本以保护隐私安全的方法,该方法包括:首先,对涉及隐私数据的多个非对抗样本进行采样,得到第一对照样本集;接着,向第一对照样本集中加入待检测的目标样本,得到第一实验样本集;然后,分别利用第一对照样本集和第一实验样本集对初始机器学习模型进行训练,得到训练后的第一对照模型和第一实验模型;再接着,利用测试样本集分别对第一对照模型和第一实验模型进行性能评估,得到针对预设评估指标的第一对照值和第一实验值;再然后,计算第一对照值和第一实验值的差值,作为目标样本针对模型性能的第一增益值。由此,可以基于第一增益值或重复上述流程而得到的多个增益值,判别目标样本是否为对抗样本。
-
公开(公告)号:CN113299295B
公开(公告)日:2022-12-30
申请号:CN202110513396.X
申请日:2021-05-11
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供了一种声纹编码网络的训练方法,包括:获取第一语音片段对应的声学特征和说话人标识;将该声学特征输入声纹编码网络,得到第一编码向量;确定第一训练损失,其负相关于该说话人标识对应的类别权重向量与第一编码向量之间的第一相似度,且正相关于预先设定的边际参数;确定第二训练损失,该第二训练损失正相关于第一语音片段与其同类语音片段各自所对应编码向量之间的同类间距离,且负相关于第一语音片段与其异类语音片段各自所对应编码向量之间的第一异类间距离;基于第一训练损失和第二训练损失,训练声纹编码网络和类别权重向量。
-
公开(公告)号:CN113536383A
公开(公告)日:2021-10-22
申请号:CN202110957071.0
申请日:2021-01-27
Applicant: 支付宝(杭州)信息技术有限公司
Inventor: 熊涛
Abstract: 本说明书实施例提供一种基于隐私保护训练图神经网络的方法和装置,该方法包括,首先获取原始关系网络图,图中任意的第一节点具有对应的邻居节点集。对于该邻居节点集中任意的第二节点,将该第二节点的节点信息,第一节点的节点信息,第二节点与第一节点的连接信息输入多层神经网络,得到该第二节点与第一节点的匹配度。然后,根据邻居节点集中各个邻居节点分别对应的匹配度,对该邻居节点集进行采样,得到第一节点的采样邻居节点集。接着,基于原图中各个节点各自对应的采样邻居节点集,形成稀疏关系网络图。于是,基于该稀疏关系网络图,训练图神经网络。
-
公开(公告)号:CN112668693A
公开(公告)日:2021-04-16
申请号:CN202011398067.7
申请日:2020-12-03
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供了用于检测异常的业务指标的方法和装置。根据实施例的方法,首先将获取的业务指标的原始时间序列数据输入到已训练的神经网络中,由于该已训练的神经网络为从前向后传播的神经网络,且包括一个输入节点和一个输出节点,在训练阶段的目标损失函数包括正则化项,因此可以得到剔除异常值的目标时间序列数据,这提高了目标时间序列数据的准确性;然后可以获得更为准确的原始时间序列数据与目标时间序列数据的残差,从而基于对残差的异常检测结果,可以得到更为准确的异常的业务指标。由于以上方案不需要针对时间序列进行多次参数迭代和人工校准来提高准确率,因此可以提高业务指标异常检测的普适性。
-
公开(公告)号:CN112559640A
公开(公告)日:2021-03-26
申请号:CN202011409591.X
申请日:2020-12-06
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种图谱表征系统的训练方法,该图谱表征系统包括图神经网络、多个节点级学习向量、多个中间级学习向量和多个图谱级学习向量。该方法包括:先获取第一训练样本,其中包含对应的两个关系图谱和相似度标签值,任一的第一关系图谱包括多个对象节点;接着,利用图神经网络对第一关系图谱进行图嵌入处理,得到多个对象节点嵌入向量;然后,基于该多个对象节点嵌入向量,依次利用节点相似记忆组件、节点‑图谱相似记忆组件和图谱相似记忆组件,提取不同尺度的信息,从而得到第一关系图谱的绝对化的图谱表征向量;再接着,计算对应两个关系图谱的两个图谱表征向量之间的相似度预测值,并结合相似度标签值,训练上述图谱表征系统。
-
公开(公告)号:CN112541129A
公开(公告)日:2021-03-23
申请号:CN202011409575.0
申请日:2020-12-06
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/9536 , G06N3/04 , G06N3/08 , G06K9/62 , G06Q40/04
Abstract: 本说明书实施例提供一种处理交互事件的方法及装置,在处理方法中,获取新增交互事件。在已有动态交互图中,确定出新增交互事件对应的两个目标节点,并建立新增连接边。至少对两个目标节点的节点信息进行融合,得到事件交互信息。根据两个目标节点各自所在最近历史交互事件与新增交互事件的交互时间差,以及事件交互信息,分别更新两个目标节点各自的隐含向量。确定各阶邻居节点。针对各阶邻居节点中任意的第一邻居节点,基于其所在最近历史交互事件与新增交互事件的交互时间差、第一邻居节点与对应目标节点的第一距离,以及两个目标节点各自的更新的隐含向量,确定对应于第一邻居节点的传播信息。根据传播信息,更新第一邻居节点的隐含向量。
-
-
-
-
-
-
-
-
-