-
公开(公告)号:CN119273947A
公开(公告)日:2025-01-07
申请号:CN202411430010.9
申请日:2024-10-14
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种匹配点对生成方法及装置,该方法包括:获得针对同一场景的不同角度的第一图像和第二图像各自的、第一尺寸的第一特征图和第二特征图及第二尺寸的第三特征图和第四特征图之后;利用小尺寸的第一特征图和第二特征图对应的匹配特征点对,从大尺寸的第三特征图和第四特征图中,确定出匹配特征点对对应的特征块对;基于特征块对中的第一特征块中至少部分特征点和第二特征块中至少部分特征点之间的相似性,更新特征块对对应的当前的单应矩阵,得到特征块对对应的目标单应矩阵;基于目标单应矩阵,确定第一图像和第二图像之间的匹配点对,实现对图像间匹配点对的确定。
-
公开(公告)号:CN119007861A
公开(公告)日:2024-11-22
申请号:CN202410918028.7
申请日:2024-07-09
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书一个或多个实施例提供一种气体浓度预测模型训练方法及装置。其中,该方法包括:获取携带有目标气体的浓度标签的样本集;所述样本集包含多条样本数据,每条样本数据用于记录至少一种与目标气体的浓度存在关联关系的协变量;将所述样本集包含的样本数据输入待训练的气体浓度预测模型;其中,所述气体浓度预测模型包括注意力模块和预测模块,所述注意力模块用于从输入的样本数据中提取注意力信息,该注意力信息被用于与所述样本集包含的样本数据进行拼接,且得到的拼接数据进一步被输入所述预测模块,以由所述预测模块输出所述目标气体的预测浓度;根据所述预测浓度与所述浓度标签的差异,对所述气体浓度预测模型进行迭代训练。
-
公开(公告)号:CN114925813B
公开(公告)日:2024-10-18
申请号:CN202210573722.0
申请日:2022-05-25
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N3/045 , G06N3/0464 , G06N3/084 , G06V10/774 , G06V10/764 , G06V10/25 , G06V10/82
Abstract: 本说明书实施例提供一种目标检测系统的训练方法,所述目标检测系统包括主干网络和头部网络,所述主干网络包括若干卷积层和若干自注意力层,所述方法包括:将训练图片输入所述目标检测系统,其中,利用所述若干卷积层对所述训练图片进行卷积处理,得到卷积表征;利用所述若干注意力层基于所述卷积表征进行自注意力处理,得到特征图;利用所述头部网络处理所述特征图,得到所述训练图片中目标对象的检测结果;基于所述训练图片对应的对象标注数据以及所述检测结果,确定各个神经网络层各自的梯度范数;针对所述各个神经网络层,根据所述梯度范数的平均数和其自身的梯度范数,更新其网络参数。
-
公开(公告)号:CN118691721A
公开(公告)日:2024-09-24
申请号:CN202410692380.3
申请日:2024-05-30
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06T13/40 , G06T15/00 , G06T15/08 , G06T15/20 , G06V40/10 , G06V40/16 , G06V10/82 , G06N3/045 , G06N3/0475 , G06N3/09
Abstract: 本说明书实施例提供一种训练生成模型的方法和装置,其中生成模型用于生成人像渲染数据。训练方法包括,首先利用多个不同人像I D的多个视频,进行多轮联合训练。其中,针对任意目标I D的联合训练包括,利用身份编码器,从目标I D对应的目标视频的视频帧中提取I D专有特征,其中包括,目标I D外形特征、目标I D超网络参数。将目标I D超网络参数施加于生成模型的I D专用部分,得到改造的生成模型;然后利用改造的生成模型处理驱动信号和目标I D外形特征,得到渲染数据。根据渲染数据和目标视频,更新身份编码器和生成模型中的共享部分。联合训练之后,还可以执行针对特定I D的专用训练,得到特定I D专用的生成模型。
-
公开(公告)号:CN118429491A
公开(公告)日:2024-08-02
申请号:CN202410525780.5
申请日:2024-04-28
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06T13/40 , G06T15/00 , G06T15/08 , G06T17/10 , G06T17/20 , G06V40/16 , G06V40/20 , G06V10/82 , G06V10/80 , G06F18/25 , G10L25/03 , G10L25/30 , G06N3/0455 , G06N3/09 , H04N21/44 , H04N21/81
Abstract: 本说明书实施例提供一种生成动态人像的方法和装置。方法包括:基于第一人像图片,提取面部的表情特征以及躯干特征;并提取第一语音片段对应的音频特征。利用第一神经网络处理原始空间中任意的第一空间位置和面部特征,得到与面部相关的第一变形特征,并通过叠加第一变形特征得到第二空间位置,其中面部特征包括表情特征和音频特征。然后,利用第二神经网络处理第二空间位置和躯干特征,得到与躯干相关的第二变形特征,并通过叠加第二变形特征得到第三空间位置。接着利用静态网络模块处理第三空间位置,得到对应的颜色和体密度。各个空间位置的颜色和体密度,用于渲染生成第一语音片段对应的第二人像图片。
-
公开(公告)号:CN117523297A
公开(公告)日:2024-02-06
申请号:CN202311546380.4
申请日:2023-11-20
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V10/764 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/09
Abstract: 本说明书的实施例提供了一种图像生成模型的训练方法、模型联合训练的方法和装置。在该图像生成模型的训练方法中,利用原始图像数据集循环执行下述模型训练过程:将当前原始图像数据提供给当前图像生成模型,得到修改后图像数据以及对应的用于指示修改信息的标签数据;进而将修改后图像数据提供给基于初始训练样本集进行初始化的当前图像篡改检测模型,得到对应的篡改检测结果;基于所得到的篡改检测结果,确定图像生成模型在当前模型训练过程的奖励值;基于强化学习算法根据所确定的奖励值调整当前图像生成模型的参数,直至满足第一训练结束条件,其中,经过模型参数调整后的图像生成模型充当下一模型训练过程的当前图像生成模型。
-
公开(公告)号:CN116843798A
公开(公告)日:2023-10-03
申请号:CN202310810626.8
申请日:2023-07-03
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06T13/00
Abstract: 本说明书实施例提供了动画生成方法、模型训练方法及装置,动画生成方法的一具体实施方式包括:获取用户针对目标音频自定义的情感序列,情感序列包括按时序排列的若干情感类别,各情感类别用于指示待生成的动画中呈现的面部情感或表情;将目标音频和情感序列输入到参数预测模型进行模型处理,得到参数序列,参数序列包括按时序排列的多个参数组;根据各个参数组,生成对应的包括面部的动画片段,从而生成目标动画。生成的动画可以指示按照时序排列的一系列的情感或表情,生成的动画的生动性较强。
-
公开(公告)号:CN116524188A
公开(公告)日:2023-08-01
申请号:CN202310486635.6
申请日:2023-04-28
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V10/26 , G06V20/13 , G06V10/764 , G06V10/44 , G06V10/82 , G06N3/0464 , G06N3/08 , G06N3/0455 , G06N3/09 , G06N5/04
Abstract: 公开了一种用于对遥感影像执行语义分割的方法,包括:使用语义分割网络对遥感影像执行语义分割,使用知识推理模块基于遥感领域知识图谱对语义分割结果执行知识推理,以及将知识推理得到的消息作为辅助信息输入至语义分割网络,对遥感影像再次执行语义分割。还公开了用于对遥感影像执行语义分割的系统、装置和介质。
-
公开(公告)号:CN115482548A
公开(公告)日:2022-12-16
申请号:CN202211149551.5
申请日:2022-09-21
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V30/412 , G06V30/413 , G06V30/414 , G06N3/04 , G06N3/08 , G06Q40/08 , G06V10/82 , G06V30/16
Abstract: 本说明书提供的表格识别方法和系统,获取包含目标表格的目标表格图像,所述目标表格包括多个文字区域,基于所述多个文字区域的位置从目标表格图像中提取表格结构,表格结构包括多个文字区域在第一方向上分布的位置数据和在第二方向上分布的位置数据,基于表格结构从目标表格图像中提取目标表格的内容数据,并将目标表格的内容数据按照表格结构输出。所述表格识别方法取决于文字区域的位置数据,因此无论目标表格是横平竖直的还是扭曲的,都能准确地识别出来,且不限于是有线的表格还是无线的表格。
-
公开(公告)号:CN111814771B
公开(公告)日:2021-01-05
申请号:CN202010923823.7
申请日:2020-09-04
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种图像处理的方法和装置,将光谱遥感图像切割为多个待处理图像进行处理,尽可能保留光谱遥感图像的信息。在处理光谱遥感图像时,按照不同的分辨率,对光谱遥感图像在多个尺度(对应分辨率)上进行缩放,从而得到各个尺度分别的语义分割结果,以及相应的注意力图。进一步地,利用注意力图,对各个语义分割结果进行融合。该方法引入注意力图,来描述语义分割的重要度,从而提高目标识别结果的准确度。
-
-
-
-
-
-
-
-
-