-
公开(公告)号:CN118711590A
公开(公告)日:2024-09-27
申请号:CN202410978025.2
申请日:2024-07-19
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书公开了一种基于大语言模型的任务执行方法、装置、介质及设备,在接收第一分辨率的初始图像后,切分初始图像,得到若干个第二分辨率的图像块,并将每个图像块输入到用于转化第二分辨率的图像的视觉模块中,得到各图像块对应的编码数据,合并若干个图像块对应的编码数据,得到综合编码数据,将综合编码数据输入到预先调整的大语言模型中,得到初始图像对应的输出结果,并根据输出结果,执行目标任务。通过用于转化第二分辨率图像的视觉模块转化初始图像被切分出的若干个图像块,而后合并得到的若干个编码数据得到综合编码数据,实现了通过对应较小分辨率的视觉模块处理不同分辨率的图像,提高了大语言模型的图像处理效率。
-
公开(公告)号:CN117931400A
公开(公告)日:2024-04-26
申请号:CN202410077918.X
申请日:2024-01-18
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F9/48 , G06F18/213 , G06F18/25 , G06F16/332 , G06N3/0455 , G06N3/08
Abstract: 本说明书公开了一种任务执行方法、装置、存储介质及电子设备。该任务执行方法包括:接收针对目标数据的任务执行请求;根据任务执行请求,将目标数据输入预设的业务模型中,以使业务模型确定目标数据中包含的各数据单元,并针对每个数据单元,根据该数据单元与目标数据中的每个数据单元之间的关联程度,确定该数据单元对应的数据特征以及该数据单元对应的第一权重,第一权重用于表征该数据单元相对于目标数据的重要程度;将第一权重小于预设权重阈值的各数据单元所对应的数据特征进行融合,得到融合特征;根据融合特征以及未被融合的各数据特征,确定目标数据对应的目标特征,以根据目标特征执行任务。
-
公开(公告)号:CN116881651A
公开(公告)日:2023-10-13
申请号:CN202310757321.5
申请日:2023-06-25
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供了一种应用于无障碍场景下人机识别的表征模型的训练方法和装置、人机识别方法和装置。该训练方法包括:接收该终端设备侧的传感器采集到的、由用户的行为产生的数据;对于接收到的同一笔传感器的数据,进行至少两次改动计算;其中,每次改动计算的改动幅度小于预设幅度阈值;利用待训练的表征模型分别得到至少两次改动计算后的数据的各表征;根据所述至少两次改动计算后的数据的各表征,计算loss;利用loss调整待训练的表征模型的参数,直到损失函数收敛;其中,当至少两次改动计算后的数据的各表征在所述表征模型的特征空间中的各位置之间的距离小于第一预设距离阈值时,该损失函数收敛。本说明书实施例能够更为有效地进行无障碍场景下的人机识别。
-
公开(公告)号:CN113222809B
公开(公告)日:2023-05-26
申请号:CN202110555973.1
申请日:2021-05-21
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书披露的实施例提供的一种实现隐私保护的图片处理方法,包括:响应于用户基于读屏模式下的终端发出的图片操作,对所述图片操作所针对的原始图片进行人脸检测,从而提取若干张人脸图像;从所述若干张人脸图像中,确定对应所述用户的用户人脸图像;基于所述原始图片中所述用户人脸图像所在的区域进行脱敏处理,得到脱敏图片。如此,实现对视障用户的人脸等隐私信息的保护。
-
公开(公告)号:CN113222809A
公开(公告)日:2021-08-06
申请号:CN202110555973.1
申请日:2021-05-21
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书披露的实施例提供的一种实现隐私保护的图片处理方法,包括:响应于用户基于读屏模式下的终端发出的图片操作,对所述图片操作所针对的原始图片进行人脸检测,从而提取若干张人脸图像;从所述若干张人脸图像中,确定对应所述用户的用户人脸图像;基于所述原始图片中所述用户人脸图像所在的区域进行脱敏处理,得到脱敏图片。如此,实现对视障用户的人脸等隐私信息的保护。
-
公开(公告)号:CN119478765A
公开(公告)日:2025-02-18
申请号:CN202411426958.7
申请日:2024-10-12
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供了视频检测处理方法及装置,其中,一种视频检测处理方法包括:在待检测视频的检测过程中,通过对待检测视频的视频帧进行对象检测和图像提取获得对象图像,在对对象图像进行差分处理的基础上对获得的差分图像进行特征提取获得差分特征序列,并将各视频帧的视频特征序列与差分特征序列进行拼接,将拼接获得的特征序列输入视频检测模块进行机器生成视频的检测获得检测结果,以此实现待检测视频是否为机器生成视频的检测。
-
公开(公告)号:CN119296107A
公开(公告)日:2025-01-10
申请号:CN202411321613.5
申请日:2024-09-20
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V30/14 , G06V30/146
Abstract: 本说明书公开了一种文字识别方法、装置、存储介质及电子设备。在此方法中,获取待识别图像,确定待识别图像中包含的各待识别区域,针对每个待识别区域,根据确定出的该待识别区域所对应的字符类型,确定该待识别区域所适用的字典,并通过预设的识别模型,对待识别图像中每个待识别区域内所包含的文字信息进行识别,以及通过识别模型,得到该待识别区域中所包含的每个字符的候选识别结果,并针对该待识别区域中所包含的每个字符,从通过识别模型得到的该字符的候选识别结果中确定出位于该待识别区域所适用的字典中的识别结果,作为该字符的实际识别结果,根据待识别区域中所包含的每个字符的实际识别结果,确定针对待识别图像的文字识别结果。
-
公开(公告)号:CN118298223A
公开(公告)日:2024-07-05
申请号:CN202410384163.8
申请日:2024-03-29
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V10/764 , G06V30/41 , G06V30/148 , G06F18/24
Abstract: 本说明书实施例提供了一种数据处理方法、装置及设备,其中,方法包括:获取与目标用户触发执行目标业务对应的图片凭证数据;获取与所述目标业务对应的预先训练的业务处理模型;通过所述预先训练的业务处理模型的第二模块,确定所述图片凭证数据中包含文本信息的不同区域的子图片凭证数据,并对所述子图片凭证数据分别进行文本特征提取处理,得到所述图片凭证数据对应的文本特征信息;通过所述预先训练的业务处理模型的第一模块,对所述文本特征信息进行凭证解析处理,得到针对所述图片凭证数据的凭证解析结果;基于所述凭证解析结果,确定针对所述目标用户触发执行所述目标业务对应的业务处理结果。
-
公开(公告)号:CN118212508A
公开(公告)日:2024-06-18
申请号:CN202410141245.X
申请日:2024-01-31
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V20/00 , G06V10/82 , G06V30/148 , G06V30/18 , G06V30/19
Abstract: 本说明书实施例公开了一种篡改检测方法、装置、存储介质及电子设备,包括:对待检测证件图像进行字符检测,得到从待检测证件中检测到的各第一字符以及各第一字符分别对应的字符位置,然后对第一字符进行字体表征提取处理,得到各第一字符分别对应的第一字体表征,以及根据第一字符对应的字符位置在位置表征映射表中确定与第一字符对应的第二字体表征,其中位置表征映射表包括字符位置和第二字体表征的映射关系,第二字体表征为对应字符位置处未被篡改的真实字符对应的字体表征,最后通过对比第一字体表征和第二字体表征之间的差异判断第一字符是否存在篡改,若待检测证件中存在被篡改的第一字符,则确定待检测证件被篡改。
-
公开(公告)号:CN118196530A
公开(公告)日:2024-06-14
申请号:CN202410382755.6
申请日:2024-03-29
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V10/764 , G06V10/82 , G06N3/0455 , G06N3/08
Abstract: 本说明书实施例提供了一种数据处理方法、装置及设备,其中,方法包括:基于与目标用户触发执行目标业务对应的图片数据,通过预先训练的分块预测模型,确定与所述图片数据对应的目标分块数目,所述预先训练的分块预测模型为基于图片样本数据和所述图片样本数据的第一分块数目,对由预设机器学习算法构建的预测模型进行训练得到,所述图片样本数据的第一分块数目为基于所述图片样本数据的第二分块数目对应的预测准确性分值,从多个所述第二分块数目中选取的分块数目;基于所述目标分块数目对图片数据进行分块处理,得到多个目标子图片数据;基于所述多个目标子图片数据,通过所述预先训练的分类模型,确定所述图片数据对应的分类类别。
-
-
-
-
-
-
-
-
-