-
公开(公告)号:CN112000578A
公开(公告)日:2020-11-27
申请号:CN202010872749.0
申请日:2020-08-26
Applicant: 支付宝(杭州)信息技术有限公司
Inventor: 宗志远
Abstract: 本说明书实施例提供了一种人工智能系统的测试方法和装置。根据该实施例的方法,首先,获取至少一个实际检测对象,并且,生成至少一个干扰检测对象;然后,将至少一个干扰检测对象以及至少一个实际检测对象分别作为样本检测对象,组成包括至少两个样本检测对象的测试样本集;之后,从测试样本集中选取至少一个样本检测对象,每一次选取的样本检测对象可能是实际检测对象也可能是干扰检测对象,之后,将选取的对象分别输入人工智能系统,并监控人工智能系统对输入的实际检测对象或者干扰检测对象的检测结果,从而得到人工智能系统的测试结果。
-
公开(公告)号:CN111368164A
公开(公告)日:2020-07-03
申请号:CN202010114046.1
申请日:2020-02-24
Applicant: 支付宝(杭州)信息技术有限公司
Inventor: 宗志远
IPC: G06F16/951 , G06F16/955 , G06K9/62
Abstract: 本说明书实施例公开了一种爬虫识别模型训练、爬虫识别方法、装置、系统、设备及介质,包括确定指向预设隐私数据的目标行为数据及目标行为数据对应的目标行为链路,从目标行为链路中确定第一爬虫链路,将第一爬虫链路作为第一类标记样本;确定第二爬虫链路,将第二爬虫链路作为第二类标记样本;其中,第二爬虫链路的确定方式异于第一爬虫链路;确定未标记网络行为链路,将未标记网络行为链路作为未标记类样本;基于第一类标记样本、第二类标记样本及未标记类样本进行半监督学习的模型训练,得到爬虫识别模型。将爬虫识别模型用于爬虫识别,能够提高爬虫识别准确率和对隐私数据的保护作用。
-
公开(公告)号:CN111107074A
公开(公告)日:2020-05-05
申请号:CN201911284559.0
申请日:2019-12-13
Applicant: 支付宝(杭州)信息技术有限公司
Inventor: 宗志远
IPC: H04L29/06 , G06F21/62 , G06F16/951
Abstract: 本说明书实施例提供一种防止网络爬虫窃取隐私数据的方法、训练方法及装置。防止网络爬虫窃取隐私数据的方法包括:从目标客户端的网络流量数据中提取目标客户端在预设时间段内的应用程序接口API访问记录。基于目标客户端的API访问记录,生成待识别数据,所述待识别数据包括以时间和API访问量为维度的目标客户端在预设时间段内的API访问二维图。将待识别数据输入至网络爬虫识别模型,以得到所目标客户端的网络识别结果,其中,网络爬虫识别模型是基于样本数据和样本数据的网络爬虫分类标签训练得到的,样本数据包括以时间和API访问量为维度的样本用户在预设时间段内的API访问二维图。对目标客户端执行与网络爬虫识别结果相匹配的隐私数据保护措施。
-
公开(公告)号:CN111079152A
公开(公告)日:2020-04-28
申请号:CN201911286357.X
申请日:2019-12-13
Applicant: 支付宝(杭州)信息技术有限公司
Inventor: 宗志远
Abstract: 公开了一种模型部署方法、装置及设备。通过在可信执行环境TEE中不进行模型训练,而是将预先训练好的模型的预测部分,以TEE中可执行语言的形式部署至TEE环境中。对于线上需要识别的数据流,采用TEE中的公钥进行加密处理,并发送至TEE环境中进行解密,进而在TEE中进行识别,避免了识别过程中的数据外泄,实现对于隐私数据的有效保护。
-
公开(公告)号:CN110830515A
公开(公告)日:2020-02-21
申请号:CN201911285269.8
申请日:2019-12-13
Applicant: 支付宝(杭州)信息技术有限公司
Inventor: 宗志远
Abstract: 公开一种流量检测方法,应用于流量检测系统,所述方法包括:从对接的业务系统获取隐私脱敏后的训练样本流量;以及,对所述训练样本流量进行特征提取,得到对应的流量特征;将所述流量特征训练输入至基于宽度及深度架构的机器学习模型进行联合训练得到流量检测模型;响应于对所述业务系统的预测样本流量进行流量检测的指令,基于所述流量检测模型对所述预测样本流量进行流量检测,得到与所述预测样本流量对应的检测结果,从而实现对流量的广度与深度的多维度特征进行流量检测模型建模,在保证流量检测准确率的前提下,极大地提升了流量检测的实时性。
-
公开(公告)号:CN112380974B
公开(公告)日:2023-08-15
申请号:CN202011262238.3
申请日:2020-11-12
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V20/10 , G06V10/764 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/084
Abstract: 本说明书实施例公开了一种分类器优化方法、后门检测方法、装置和电子设备。所述分类器优化方法包括:将后门探针输入至携带标签的模型,所述标签用于表示模型中是否植入有后门;将所述模型的输出输入至元分类器;根据元分类器的输出和所述标签,优化所述元分类器和所述后门探针。本说明书实施例可以将携带标签的模型作为训练数据,可以利用携带标签的模型对元分类器和后门探针进行优化。优化后的元分类器和优化后的后门探针可以用于检测模型中是否植入有后门,从而提高了安全性。
-
公开(公告)号:CN112215201A
公开(公告)日:2021-01-12
申请号:CN202011176713.5
申请日:2020-10-28
Applicant: 支付宝(杭州)信息技术有限公司
Inventor: 宗志远
Abstract: 本说明书实施例提供一种评估人脸识别模型、针对图像的分类模型的方法及装置,在评估人脸识别模型的方法中,获取样本集。将样本集中任意的第一样本中的两幅人脸图像,输入预先训练的人脸识别模型,以预测第一比对结果。针对两幅人脸图像中任意的第一人脸图像,采用热力图生成方法,基于第一比对结果以及第一人脸图像,生成人脸热力图。根据人脸热力图,在第一人脸图像中确定扰动区域。采用扰动方法,对扰动区域进行扰动,得到扰动后的第一人脸图像。将扰动后的第一人脸图像以及另一幅人脸图像,输入人脸识别模型,以预测第二比对结果。根据样本集中各样本的第一比对结果和第二比对结果,确定人脸识别模型的鲁棒性评估结果。
-
公开(公告)号:CN111177757A
公开(公告)日:2020-05-19
申请号:CN201911374421.X
申请日:2019-12-27
Applicant: 支付宝(杭州)信息技术有限公司
Inventor: 宗志远
IPC: G06F21/60
Abstract: 本说明书提供一种图片中隐私信息保护的处理方法及装置,所述方法包括通过对抗样本生成方法生成对抗噪声,定位出待处理敏感图片中敏感信息所在的敏感位置后,在待处理敏感图片的敏感信息所在的敏感位置处加入对抗噪声,获得合成后的图片。加入对抗噪声后的图片使得图片识别算法或模型(如:OCR算法)无法识别出处理后的待处理敏感图片中的敏感信息,保护了用户的隐私信息,但是不影响图片本身的视觉质量,即不影响人的视觉体验。
-
公开(公告)号:CN111143654A
公开(公告)日:2020-05-12
申请号:CN201911387124.9
申请日:2019-12-25
Applicant: 支付宝(杭州)信息技术有限公司
Inventor: 宗志远
IPC: G06F16/951 , G06F16/955 , G06F40/289 , G06F40/284
Abstract: 本说明书实施例公开了一种辅助识别爬虫的、爬虫识别方法、装置和电子设备,其中,爬虫识别方法可以确定通过目标会话访问目标应用的网络资源地址的目标访问序列;然后基于预先训练得到的词向量字典,确定所述目标访问序列的特征向量,该词向量字典是以网络资源地址为分词,以多个访问序列为语料进行训练得到的;基于目标访问序列的特征向量和目标模型,确定目标会话的爬虫评估参数,该目标模型是以所述多个访问序列中爬虫用户对应的访问序列的特征向量为黑样本,以所述多个访问序列中非爬虫用户对应的访问序列的特征向量为白样本训练得到的;最后基于爬虫评估参数,确定目标会话中是否存在爬虫。本说明书实施例采用机器学习的方式识别爬虫。
-
公开(公告)号:CN111062019A
公开(公告)日:2020-04-24
申请号:CN201911286350.8
申请日:2019-12-13
Applicant: 支付宝(杭州)信息技术有限公司
Inventor: 宗志远
Abstract: 公开一种用户攻击检测方法,应用于安全检测系统,所述安全检测系统搭载了攻击检测模型。该方法包括从对接的业务系统的隐私脱敏后的实时数据流中提取用户相关的生物特征和行为特征;对所述生物特征进行防伪检测,得到对应的防伪检测结果;基于所述行为特征构建训练样本,并将所述防伪检测结果作为样本标签对所述训练样本进行样本标记;基于样本标记后的所述训练样本,对所述攻击检测模型进行训练,以对安全检测系统搭载的攻击检测模型进行实时更新,从而实现了基于攻击检测模型进行用户攻击检测,极大地提高了攻击检测的准确率和实时性。
-
-
-
-
-
-
-
-
-