Patent search ap:("支付宝(杭州)信息技术有限公司") AND inv:"王可" Page 2

11.

发明公开
加密模型训练、图像加密和加密人脸图像识别方法及装置有权

公开(公告)号：CN113592696A

公开(公告)日：2021-11-02

申请号：CN202110927877.5

申请日：2021-08-12

Applicant: 支付宝(杭州)信息技术有限公司

Inventor： 兰钧 , 王可 , 孟昌华 , 王维强

IPC: G06T1/00 , G06F21/60 , G06F21/62 , G06K9/00 , G06K9/62 , G06N3/04 , G06N3/08

Abstract: 本说明书实施例提供一种用于隐私保护的加密模型训练方法及装置、图像加密方法及装置和加密人脸图像识别方法及装置，该加密模型训练方法包括：利用待训练的加密模型对原始人脸图像加密，得到加密人脸图像；将加密人脸图像输入待训练的第一人脸识别模型，得到第一人脸预测结果；利用第一人脸预测结果和原始人脸图像对应的人脸标注结果，确定第一预测损失；将加密人脸图像输入判别模型，通过判别模型得到加密人脸图像为噪声图像的第一预测概率；根据与第一预测损失正相关，与第一预测概率负相关确定总预测损失；以最小化总预测损失为目标，训练加密模型以及第一人脸识别模型。

12.

发明授权
一种决策模型的训练方法、小程序巡检方法及装置有权

公开(公告)号：CN117725975B

公开(公告)日：2024-12-06

申请号：CN202410177223.9

申请日：2024-02-08

Applicant: 支付宝(杭州)信息技术有限公司

Inventor： 王可 , 孟昌华

IPC: G06N3/08 , G06F11/34 , G06N3/0475 , G06N20/00

Abstract: 本说明书一个或多个实施例公开了一种决策模型的训练方法，包括：获取用户的意图标签，以及用户基于所述意图标签所描述的意图与网页进行交互的交互动作序列；获取用户在执行所述交互动作序列的过程中所交互的网页图像样本；将所述网页图像样本和所述意图标签输入生成模型，得到决策结果；基于所述决策结果和决策标签确定损失函数，来更新所述生成模型的参数，以得到目标决策模型。该方法提供的决策模型能够针对不同的小程序进行自动化决策，以快速生成巡检路径。相应地，本说明书还公开了决策模型的训练装置、小程序巡检方法及装置。

13.

发明公开
一种模型训练以及页面检测方法、装置、介质及设备有权

公开(公告)号：CN119046174A

公开(公告)日：2024-11-29

申请号：CN202411535888.9

申请日：2024-10-30

Applicant: 支付宝(杭州)信息技术有限公司

Inventor： 徐恪 , 夏天宇 , 赵乙 , 王可 , 顾章轩 , 申书恒 , 孟昌华 , 王维强

IPC: G06F11/36 , G06F18/20 , G06V10/40 , G06F40/126 , G06N3/0455 , G06N3/08

Abstract: 本说明书公开了一种模型训练以及页面检测方法、装置、介质及设备。获取样本页面图像，样本页面图像对应的导航文本以及标签文本。将样本页面图像与导航文本输入到预设的大语言模型，以使大语言模型根据导航文本，确定输出文本，输出文本中包含有目标控件在页面中所在位置的预测坐标表征。将预测坐标表征输入到待训练的坐标解码器，得到目标控件在页面中所在位置的预测坐标。根据预测坐标与实际页面坐标之间的差异，确定综合损失值，以根据综合损失值，对坐标解码器进行训练。使得训练完成的坐标解码器能够对大语言模型输出的预测坐标表征进行纠正，提高页面检测准确性。

14.

发明授权
加密模型训练、图像加密和加密人脸图像识别方法及装置有权

公开(公告)号：CN113592696B

公开(公告)日：2024-11-12

申请号：CN202110927877.5

申请日：2021-08-12

Applicant: 支付宝(杭州)信息技术有限公司

Inventor： 兰钧 , 王可 , 孟昌华 , 王维强

IPC: G06T1/00 , G06F21/60 , G06F21/62 , G06V40/16 , G06V10/74 , G06V10/77 , G06V10/764 , G06N3/0464 , G06N3/084

Abstract: 本说明书实施例提供一种用于隐私保护的加密模型训练方法及装置、图像加密方法及装置和加密人脸图像识别方法及装置，该加密模型训练方法包括：利用待训练的加密模型对原始人脸图像加密，得到加密人脸图像；将加密人脸图像输入待训练的第一人脸识别模型，得到第一人脸预测结果；利用第一人脸预测结果和原始人脸图像对应的人脸标注结果，确定第一预测损失；将加密人脸图像输入判别模型，通过判别模型得到加密人脸图像为噪声图像的第一预测概率；根据与第一预测损失正相关，与第一预测概率负相关确定总预测损失；以最小化总预测损失为目标，训练加密模型以及第一人脸识别模型。

15.

发明授权
加密模型训练、图像加密和加密人脸图像识别方法及装置有权

公开(公告)号：CN113486839B

公开(公告)日：2024-10-22

申请号：CN202110822280.4

申请日：2021-07-20

Applicant: 支付宝(杭州)信息技术有限公司

Inventor： 兰钧 , 王可 , 孟昌华 , 王维强

IPC: G06V40/16 , G06F21/60 , G06N3/0464 , G06N3/084

Abstract: 本说明书实施例提供一种加密模型训练方法及装置、图像加密方法及装置和加密人脸图像识别方法及装置，该加密模型训练方法包括：利用待训练的加密模型对原始人脸图像加密，得到加密人脸图像；将加密人脸图像输入待训练的第一人脸识别模型，得到第一人脸预测结果；利用第一人脸预测结果及原始人脸图像对应的人脸标注结果，确定第一预测损失；分别将原始人脸图像及加密人脸图像输入经训练的第二人脸识别模型，得到各自对应的第一输出结果及第二输出结果；基于第一输出结果及第二输出结果，确定第二预测损失；基于与第一预测损失和第二预测损失正相关，确定总预测损失；以最小化总预测损失为目标，训练加密模型以及第一人脸识别模型。

16.

发明公开
一种决策模型的训练方法、小程序巡检方法及装置有权

公开(公告)号：CN117725975A

公开(公告)日：2024-03-19

申请号：CN202410177223.9

申请日：2024-02-08

Applicant: 支付宝(杭州)信息技术有限公司

Inventor： 王可 , 孟昌华

IPC: G06N3/08 , G06F11/34 , G06N3/0475 , G06N20/00

Abstract: 本说明书一个或多个实施例公开了一种决策模型的训练方法，包括：获取用户的意图标签，以及用户基于所述意图标签所描述的意图与网页进行交互的交互动作序列；获取用户在执行所述交互动作序列的过程中所交互的网页图像样本；将所述网页图像样本和所述意图标签输入生成模型，得到决策结果；基于所述决策结果和决策标签确定损失函数，来更新所述生成模型的参数，以得到目标决策模型。该方法提供的决策模型能够针对不同的小程序进行自动化决策，以快速生成巡检路径。相应地，本说明书还公开了决策模型的训练装置、小程序巡检方法及装置。

17.

发明公开
具有可靠泛化性的图像相似度匹配方法和装置审中-实审

公开(公告)号：CN114491476A

公开(公告)日：2022-05-13

申请号：CN202210077886.4

申请日：2022-01-24

Applicant: 支付宝(杭州)信息技术有限公司

Inventor： 程裕家 , 王可 , 兰钧 , 孟昌华 , 王维强

IPC: G06F21/36 , G06V10/74 , G06V10/44 , G06V10/764 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08

Abstract: 本公开的一方面涉及一种图像相似度匹配的方法，包括获取页面的截图，所述页面上包括对象序列和图片，所述对象序列包括多个对象，并且所述图片中至少包括与所述对象序列中的每个对象相对应的多个图标；在所述页面的截图上进行目标检测，以获得所述多个对象和所述多个图标；基于特征提取来确定所述多个对象和所述多个图标的特征向量；以及基于对所述特征向量之间的距离度量的比较，确定每个对象与图标的配对关系。本公开还涉及其他相关方面。

18.

发明公开
训练分类模型的方法和装置有权

公开(公告)号：CN113850300A

公开(公告)日：2021-12-28

申请号：CN202111024190.7

申请日：2021-09-02

Applicant: 支付宝(杭州)信息技术有限公司

Inventor： 王可 , 孟昌华 , 王维强

IPC: G06K9/62 , G06N3/04 , G06N3/08

Abstract: 本说明书实施例提供了一种训练分类模型的方法和装置。根据该实施例的方法，首先获取训练样本以及对各训练样本标注的类别标签，所述训练样本包括噪声样本；然后利用所述训练样本训练分类模型；其中在训练所述分类模型的过程中采用改进的交叉熵损失函数，所述改进的交叉熵损失函数用以降低对所述噪声样本的学习权重。

19.

发明授权
一种模型训练以及页面检测方法、装置、介质及设备有权

公开(公告)号：CN119046174B

公开(公告)日：2025-05-16

申请号：CN202411535888.9

申请日：2024-10-30

Applicant: 支付宝(杭州)信息技术有限公司

Inventor： 徐恪 , 夏天宇 , 赵乙 , 王可 , 顾章轩 , 申书恒 , 孟昌华 , 王维强

IPC: G06F11/3604 , G06F18/20 , G06V10/40 , G06F40/126 , G06N3/0455 , G06N3/08

Abstract: 本说明书公开了一种模型训练以及页面检测方法、装置、介质及设备。获取样本页面图像，样本页面图像对应的导航文本以及标签文本。将样本页面图像与导航文本输入到预设的大语言模型，以使大语言模型根据导航文本，确定输出文本，输出文本中包含有目标控件在页面中所在位置的预测坐标表征。将预测坐标表征输入到待训练的坐标解码器，得到目标控件在页面中所在位置的预测坐标。根据预测坐标与实际页面坐标之间的差异，确定综合损失值，以根据综合损失值，对坐标解码器进行训练。使得训练完成的坐标解码器能够对大语言模型输出的预测坐标表征进行纠正，提高页面检测准确性。

20.

发明授权
图像元素类别的识别方法及装置有权

公开(公告)号：CN115546810B

公开(公告)日：2023-04-11

申请号：CN202211507954.2

申请日：2022-11-29

Applicant: 支付宝(杭州)信息技术有限公司

Inventor： 王维强 , 顾章轩 , 王可 , 孟昌华 , 兰钧

IPC: G06V30/412 , G06V30/414

Abstract: 本说明书实施例提供一种图像元素类别的识别方法及装置，在识别方法中，从多模态的目标图像中，提取其中包含的多个文本片段，及其对应的多个边界框。针对多个边界框形成的初始集合，迭代执行若干轮次的切分操作，其中单论切分操作根据边界框的轴向投影，将本轮当前集合划分为多个子集合，并确定各个子集合的相对排序，直至得到各个边界框的排序编号，该排序编号指示各个边界框的阅读顺序。至少将多个文本片段、多个边界框及其各自的排序编号，输入类别预测模型进行识别处理，得到目标图像中包含的各个元素的类别。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification