-
公开(公告)号:CN118799674A
公开(公告)日:2024-10-18
申请号:CN202410281894.X
申请日:2024-03-12
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
IPC: G06V10/774 , G06F18/25 , G06N3/045 , G06N3/08
Abstract: 本申请公开了一种模型训练方法,该方法包括:获取待训练样本数据;其中,所述待训练样本数据包括图像样本数据和所述图像样本数据对应的文本标签;采用所述待训练样本数据对待训练模型进行模型训练,直至得到已训练好的对象识别模型;其中,所述待训练模型至少包括:对所述待训练样本数据进行文本特征和图像特征进行融合处理的融合处理网络,对所述待训练样本数据进行视觉分析的视觉主干网络,和对所述待训练样本数据和融合处理网络的输出结果进行文本分析的文本主干网络。本申请还公开一种识别方法、装置、设备、存储介质及计算机程序产品。
-
公开(公告)号:CN118799547A
公开(公告)日:2024-10-18
申请号:CN202410282155.2
申请日:2024-03-12
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
IPC: G06V10/25 , G06V10/774 , G06V10/82
Abstract: 本申请公开了一种目标检测方法、装置、电子设备、产品及存储介质。方法包括:获取第一场景下的第一图像数据集以及第一图文数据集对应的第一图像描述文本和第一图像数据;在第二场景下对所述第一图像数据集和所述第一图像数据进行操作处理,生成第二图像数据;基于所述第一图像数据集和所述第一图像数据确定第二图像描述文本;将所述第一图像描述文本和所述第二图像数据输入至初始图文大模型中,得到目标图文大模型;基于所述第一图像描述文本、所述第二图像数据、所述第二图像描述文本和所述目标图文大模型进行目标检测。
-