-
公开(公告)号:CN120029673A
公开(公告)日:2025-05-23
申请号:CN202510389327.0
申请日:2025-03-28
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F9/318 , G06N5/04 , G06N3/045 , G06N3/08 , G06F18/241
Abstract: 本说明书实施例提供一种目标领域下的大模型微调方法和装置。方法包括:获取多个样本构成的训练数据集;任一样本包括输入文本和期望响应,所述输入文本包括所述目标领域的请求任务和执行所述请求任务的指令;所述期望响应包括标签思考路径、基于所述标签思考路径和检索到的若干文档得到的标签回答;所述标签思考路径包括所述请求任务的概念分类、基于所述概念分类确定的关联信息;利用所述训练数据集对大模型进行指令微调,以得到目标领域下的大模型。能够进一步提高大模型在垂直领域上的表现。
-
公开(公告)号:CN114092804B
公开(公告)日:2025-02-21
申请号:CN202111309422.3
申请日:2021-11-06
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供了一种遥感图像的识别方法和装置。该方法包括:获取对应于同一地块的至少两张遥感图像;该至少两张遥感图像是在至少两个不同时间上对该同一地块进行拍摄后得到的;对所述至少两张遥感图像分别进行特征提取,得到至少两张原始特征图;根据每一张原始特征图对应的遥感图像的拍摄时间,对所述至少两张原始特征图在时序上进行信息融合,得到融合特征图;利用该融合特征图,对遥感图像进行识别。本说明书能够更为准确地对遥感图像进行识别。
-
公开(公告)号:CN116740745A
公开(公告)日:2023-09-12
申请号:CN202310659522.1
申请日:2023-06-05
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V30/413 , G06V30/19 , G06N3/0455
Abstract: 本说明书实施例提供用于检测图片数据中的文字区域的方法及装置。在该方法中,从图片数据中提取特征图;以及对图片数据中的各个像素点的像素点位置进行二维位置编码,得到各个像素点的位置编码嵌入。随后,使用特征图中的各个像素点的像素点特征嵌入以及对应的位置编码嵌入进行编码,得到各个像素点的编码输出嵌入;并且根据各个像素点的编码输出嵌入确定所述候选文字区域集。接着,使用各个像素点的编码输出嵌入以及候选文字区域集中的各个候选文字区域的位置编码嵌入进行解码,得到各个候选文字区域的解码输出嵌入,每个候选文字区域包括定义用于拟合该候选文字区域的区域边界的两条贝塞尔曲线的控制点集,以及每个候选文字区域的位置编码嵌入包括对应控制点集中的各个控制点的位置编码嵌入。然后,根据各个候选文字区域的解码输出嵌入,在各个候选文字区域中预测目标文字区域。
-
公开(公告)号:CN116521895A
公开(公告)日:2023-08-01
申请号:CN202310493492.1
申请日:2023-04-28
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/36 , G06F16/35 , G06F16/33 , G06V20/10 , G06V20/13 , G06V10/764 , G06V10/80 , G06V10/40 , G06V10/44 , G06V10/82 , G06N3/0464 , G06N5/02
Abstract: 公开了一种用于生成遥感影像的场景图的方法,包括:生成遥感影像中的目标集合;基于遥感领域知识图谱选择多个存在潜在关系的目标对;以及对目标对执行关系预测以生成该遥感影像的场景图。还公开了用于生成遥感影像的场景图的系统、装置和介质。
-
公开(公告)号:CN116310638A
公开(公告)日:2023-06-23
申请号:CN202310184333.3
申请日:2023-02-23
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V10/774 , G06V10/764 , G06F16/36
Abstract: 公开了一种用于跨模态对齐模型的训练方法,包括:获取多个训练样本;以及使用该多个训练样本来训练所述跨模态对齐模型,其中所述跨模态对齐模型将每个样本的视觉特征和语义表示映射到隐层空间,且至少对齐同一场景的该视觉特征与该语义表示在隐层空间的分布。本申请还涉及用于分类器的训练方法、遥感影像场景分类的方法、装置和介质。
-
公开(公告)号:CN112633185B
公开(公告)日:2023-04-18
申请号:CN202011565601.9
申请日:2020-09-04
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V20/10 , G06V20/70 , G06V10/80 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/08 , G06T3/40
Abstract: 本说明书实施例提供一种图像处理的方法和装置,将光谱遥感图像切割为多个待处理图像进行处理,尽可能保留光谱遥感图像的信息。在处理光谱遥感图像时,按照不同的分辨率,对光谱遥感图像在多个尺度(对应分辨率)上进行缩放,从而得到各个尺度分别的语义分割结果,以及相应的注意力图。进一步地,利用注意力图,对各个语义分割结果进行融合。该方法引入注意力图,来描述语义分割的重要度,从而提高目标识别结果的准确度。
-
公开(公告)号:CN115937570A
公开(公告)日:2023-04-07
申请号:CN202211265241.X
申请日:2022-10-14
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V10/764 , G06Q30/0207 , G06V10/80 , G06V10/82 , G06K7/14
Abstract: 本说明书公开了一种篡改检测方法、装置、计算机程序产品、存储介质及设备,其中方法包括:获取事务图形编码,基于预训练的篡改检测模型提取所述事务图形编码中的篡改特征,并基于所述篡改特征生成所述事务图形编码对应的篡改检测结果,若所述篡改检测结果指示所述事务图形编码被篡改,则拒绝响应所述事务图形编码,并输出篡改警告信息,可以对篡改的事务图形编码进行准确识别并拦截。
-
公开(公告)号:CN115862015A
公开(公告)日:2023-03-28
申请号:CN202211247962.8
申请日:2022-10-12
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V30/10 , G06V30/19 , G06N3/0464 , G06N3/08
Abstract: 本说明书实施例提供一种文字识别系统的训练方法及装置,其中文字识别系统包括图像表征网络、字符对齐网络和字符分类器。该方法包括:利用数据增广模块对包含标签文本的原始图像进行场景渲染处理,得到增广图像;利用图像表征网络分别处理原始图像和增广图像,对应得到原图表征和增广图表征;利用字符对齐网络分别处理原图表征和增广图表征,分别得到与标签文本中各个字符对应的第一字符表征和第二字符表征;利用字符分类器处理第一字符表征,形成第一预测文本;利用字符对比模块处理第一字符表征和第二字符表征,得到对应相同字符的正表征对和对应不同字符的负表征对;基于第一预测文本、标签文本、正表征对和负表征对,训练文字识别系统。
-
公开(公告)号:CN114925813A
公开(公告)日:2022-08-19
申请号:CN202210573722.0
申请日:2022-05-25
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N3/04 , G06N3/08 , G06K9/62 , G06V10/774 , G06V10/764 , G06V10/25 , G06V10/82
Abstract: 本说明书实施例提供一种目标检测系统的训练方法,所述目标检测系统包括主干网络和头部网络,所述主干网络包括若干卷积层和若干自注意力层,所述方法包括:将训练图片输入所述目标检测系统,其中,利用所述若干卷积层对所述训练图片进行卷积处理,得到卷积表征;利用所述若干注意力层基于所述卷积表征进行自注意力处理,得到特征图;利用所述头部网络处理所述特征图,得到所述训练图片中目标对象的检测结果;基于所述训练图片对应的对象标注数据以及所述检测结果,确定各个神经网络层各自的梯度范数;针对所述各个神经网络层,根据所述梯度范数的平均数和其自身的梯度范数,更新其网络参数。
-
公开(公告)号:CN114880517A
公开(公告)日:2022-08-09
申请号:CN202210592045.7
申请日:2022-05-27
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/73 , G06F16/783 , G06F16/75
Abstract: 本说明书实施例提供了用于视频检索的方法及装置。在该方法中,获取待匹配视频中的视频帧图像;从视频帧图像中提取图像特征以及文本特征;根据用于表征聚类中心的中心变量对图像特征和所述文本特征进行特征融合,以得到融合特征,其中,中心变量用于将属于同一视频的不同模态的特征进行关联;以及根据融合特征在视频数据库中进行视频检索,以确定出视频数据库中与待匹配视频相匹配的视频,其中,视频数据库中存储有多个视频以及每个视频对应的视频特征。
-
-
-
-
-
-
-
-
-