-
公开(公告)号:CN114092949B
公开(公告)日:2025-01-03
申请号:CN202111396483.8
申请日:2021-11-23
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V30/413 , G06V10/774
Abstract: 本说明书实施例提供一种类别预测模型的训练、界面元素类别的识别方法及装置,在训练方法中,获取样本图像,该样本图像包含若干界面元素。获取各界面元素中包含的各文本内容。将样本图像以及各文本内容,输入类别预测模型进行预测处理。该预测处理包括:利用特征提取器从样本图像中提取图像特征。利用第一编码器基于各文本内容中各词的词向量,确定各文本内容的特征向量。利用第二编码器基于图像特征和各文本内容的特征向量,确定各界面元素的综合特征表示。利用分类器基于各综合特征表示,确定各界面元素的第一类别预测结果。至少根据各第一类别预测结果和各类别标签,训练类别预测模型。
-
公开(公告)号:CN113850300B
公开(公告)日:2024-08-23
申请号:CN202111024190.7
申请日:2021-09-02
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/2413 , G06F18/2415 , G06F18/2431 , G06N3/084
Abstract: 本说明书实施例提供了一种训练分类模型的方法和装置。根据该实施例的方法,首先获取训练样本以及对各训练样本标注的类别标签,所述训练样本包括噪声样本;然后利用所述训练样本训练分类模型;其中在训练所述分类模型的过程中采用改进的交叉熵损失函数,所述改进的交叉熵损失函数用以降低对所述噪声样本的学习权重。
-
公开(公告)号:CN117931032A
公开(公告)日:2024-04-26
申请号:CN202410196098.6
申请日:2024-02-21
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F3/04842 , G06F3/04845
Abstract: 本说明书实施例提供了一种基于大语言模型的数据采集方法和装置。该方法的一具体实施方式包括:对目标程序的目标页面截图进行分析,生成目标页面截图的页面描述信息;将页面描述信息和预设的提示语输入大语言模型,生成针对目标程序的推荐测试任务,并将推荐测试任务提供给执行测试的用户,其中,提示语用于提示大语言模型生成针对目标程序的测试任务;针对目标程序执行若干次行为采集操作,得到体现用户行为的页面截图序列,其中单次行为采集操作包括:接收用户基于推荐测试任务针对目标程序的第一页面截图执行的目标操作;根据目标操作将第一页面截图更新为第二页面截图,并通过第一页面截图和/或第二页面截图显示目标操作。
-
公开(公告)号:CN117851794A
公开(公告)日:2024-04-09
申请号:CN202311848032.2
申请日:2023-12-28
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/21 , G06F18/214 , G06F21/36 , G06F21/62
Abstract: 本说明书涉及一种风险识别模型的训练方法及系统,训练方法包括获取各训练样本,其中每个训练样本包括应用的图标和应用的名称,训练样本的标签为应用的实际风险结果;获取第一风险识别模型和第二风险识别模型;分别利用第一风险识别模型和第二风险识别模型从各训练样本中选择第一有用样本和第二有用样本;利用第一有用样本对第二风险识别模型进行训练,利用第二有用样本对第一风险识别模型进行训练。本说明的风险识别模型的训练方法及系统,利用包括应用的图标和应用的名称的训练样本对风险识别模型进行训练,从而基于应用的图标和名称得到应用的风险结果,且在训练过程中消除了噪声样本的影响,使得训练好的风险识别模型准确性更高。
-
公开(公告)号:CN116127460A
公开(公告)日:2023-05-16
申请号:CN202310322923.8
申请日:2023-03-29
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F21/56 , G06F21/44 , G06V10/40 , G06V10/74 , G06V10/774
Abstract: 本说明书实施例提供了一种仿冒APP发现方法及装置、介质、设备。方法包括对待识别APP的图标进行编码,得到第一编码向量;根据所述待识别APP的第一编码向量和特征向量库中的每一个第二编码向量,计算所述待识别APP的图标和所述特征向量库中该第二编码向量对应的图标之间的视觉相似度;若计算得到的各个视觉相似度中的最大值大于预设阈值,则确定该最大值对应的第一正版APP;判断所述第一正版APP的开发者标识与所述待识别APP的开发者标识是否相同,并根据判断结果确定所述待识别APP是否为仿冒APP。本说明书实施例能够识别出仿冒APP,进而减少用户的隐私泄露和财产损失。
-
公开(公告)号:CN114092949A
公开(公告)日:2022-02-25
申请号:CN202111396483.8
申请日:2021-11-23
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V30/413 , G06V10/774 , G06K9/62
Abstract: 本说明书实施例提供一种类别预测模型的训练、界面元素类别的识别方法及装置,在训练方法中,获取样本图像,该样本图像包含若干界面元素。获取各界面元素中包含的各文本内容。将样本图像以及各文本内容,输入类别预测模型进行预测处理。该预测处理包括:利用特征提取器从样本图像中提取图像特征。利用第一编码器基于各文本内容中各词的词向量,确定各文本内容的特征向量。利用第二编码器基于图像特征和各文本内容的特征向量,确定各界面元素的综合特征表示。利用分类器基于各综合特征表示,确定各界面元素的第一类别预测结果。至少根据各第一类别预测结果和各类别标签,训练类别预测模型。
-
公开(公告)号:CN113486839A
公开(公告)日:2021-10-08
申请号:CN202110822280.4
申请日:2021-07-20
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种加密模型训练方法及装置、图像加密方法及装置和加密人脸图像识别方法及装置,该加密模型训练方法包括:利用待训练的加密模型对原始人脸图像加密,得到加密人脸图像;将加密人脸图像输入待训练的第一人脸识别模型,得到第一人脸预测结果;利用第一人脸预测结果及原始人脸图像对应的人脸标注结果,确定第一预测损失;分别将原始人脸图像及加密人脸图像输入经训练的第二人脸识别模型,得到各自对应的第一输出结果及第二输出结果;基于第一输出结果及第二输出结果,确定第二预测损失;基于与第一预测损失和第二预测损失正相关,确定总预测损失;以最小化总预测损失为目标,训练加密模型以及第一人脸识别模型。
-
公开(公告)号:CN114417987B
公开(公告)日:2024-12-03
申请号:CN202210028772.0
申请日:2022-01-11
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/2415 , G06F18/2113 , G06N3/04 , G06N3/08 , G06F16/27 , G06F21/62
Abstract: 本说明书实施例提供了一种模型训练方法、数据识别方法、装置及设备,包括:获取多个训练样本,将多个训练样本输入至第一模型中,确定训练样本对应的字符序列中的每个字符位的字符为预设字符的第一预测概率;并将多个训练样本输入至第二模型中,确定训练样本对应的字符序列中的每个字符位的字符为预设字符的第二预测概率;基于第一预测概率和训练样本的标签信息,从多个训练样本中选取第一数量的训练样本;并基于第二预测概率和训练样本的标签信息,从多个训练样本中选取第二数量的训练样本;基于第一数量的训练样本对第二模型进行训练,并基于第二数量的训练样本对第一模型进行训练,直到训练后的第一模型和/或训练后的第二模型满足相应的收敛条件。
-
公开(公告)号:CN115546810A
公开(公告)日:2022-12-30
申请号:CN202211507954.2
申请日:2022-11-29
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V30/412 , G06V30/414
Abstract: 本说明书实施例提供一种图像元素类别的识别方法及装置,在识别方法中,从多模态的目标图像中,提取其中包含的多个文本片段,及其对应的多个边界框。针对多个边界框形成的初始集合,迭代执行若干轮次的切分操作,其中单论切分操作根据边界框的轴向投影,将本轮当前集合划分为多个子集合,并确定各个子集合的相对排序,直至得到各个边界框的排序编号,该排序编号指示各个边界框的阅读顺序。至少将多个文本片段、多个边界框及其各自的排序编号,输入类别预测模型进行识别处理,得到目标图像中包含的各个元素的类别。
-
公开(公告)号:CN114417987A
公开(公告)日:2022-04-29
申请号:CN202210028772.0
申请日:2022-01-11
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供了一种模型训练方法、数据识别方法、装置及设备,包括:获取多个训练样本,将多个训练样本输入至第一模型中,确定训练样本对应的字符序列中的每个字符位的字符为预设字符的第一预测概率;并将多个训练样本输入至第二模型中,确定训练样本对应的字符序列中的每个字符位的字符为预设字符的第二预测概率;基于第一预测概率和训练样本的标签信息,从多个训练样本中选取第一数量的训练样本;并基于第二预测概率和训练样本的标签信息,从多个训练样本中选取第二数量的训练样本;基于第一数量的训练样本对第二模型进行训练,并基于第二数量的训练样本对第一模型进行训练,直到训练后的第一模型和/或训练后的第二模型满足相应的收敛条件。
-
-
-
-
-
-
-
-
-