-
公开(公告)号:CN117392688A
公开(公告)日:2024-01-12
申请号:CN202311289458.9
申请日:2023-10-07
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书公开了一种图像分类的方法、装置、存储介质及电子设备,用于隐私保护,可以获取待识别图像,对该待识别图像中包含的文本信息进行识别,得到识别结果,而后,根据该识别结果,确定待识别图像中包含的文本信息以及确定文本信息在待识别图像中的布局信息,待识别图像和文本信息输入到预先训练的分类模型中的第一特征提取层中,得到待识别图像的图像特征和文本信息的文本特征,以及将布局信息输入分类模型中的第二特征提取层中得到布局特征,通过分类模型中的特征融合层,将图像特征、文本特征以及布局特征进行融合,得到融合特征,并根据融合特征得到分类结果,根据分类结果,以对待识别图像进行图像分类,提高了图像分类的准确率。
-
公开(公告)号:CN118195029A
公开(公告)日:2024-06-14
申请号:CN202410382851.0
申请日:2024-03-29
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书公开了一种任务执行方法、装置、存储介质及电子设备,该任务执行方法包括:接收用户输入的目标语句以及数据描述信息,数据描述信息用于对期望生成的任务数据的数据格式、数据内容以及涉及的目标业务场景进行限制;将目标语句以及数据描述信息输入目标大语言模型,以使得目标大语言模型,根据数据描述信息,在目标语句的基础上生成针对目标业务场景的任务数据;根据任务数据执行任务。本方案可以获取充足、有效的任务数据,以保证后续任务的顺利执行。
-
公开(公告)号:CN118193788A
公开(公告)日:2024-06-14
申请号:CN202410383785.9
申请日:2024-03-29
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/75 , G06V10/764 , G06V10/82 , G06N3/045 , G06N3/08 , G06V30/148
Abstract: 本说明书提供了一种视频数据分类方法、装置以及介质中,通过确定视频数据,作为训练样本,并确定视频数据对应的各文本段。确定所述各文本段对应的来源特征,然后将训练样本、各文本段以及各文本段对应的来源特征输入视频分类模型,确定预测分类结果。以预测分类结果与训练样本对应的分类标签之间的差异最小为优化目标,训练待训练的视频分类模型,以根据训练完成的视频分类模型执行业务。通过特征提取网络确定各文本段对应特征,辅助视频分类模型可以更好的理解各文本段的语义以及视频内容的数据,实现对视频数据更加准确的分类,已便根据视频数据的分类更好的执行相应业务。
-
-