-
公开(公告)号:CN119152342A
公开(公告)日:2024-12-17
申请号:CN202411197559.8
申请日:2024-08-29
Applicant: 安徽大学
IPC: G06V10/82 , G06V10/80 , G06V10/44 , G06V10/42 , G06V10/52 , G06V20/70 , G06N3/0464 , G06N3/0455 , G06N3/084
Abstract: 本发明涉及图像处理领域,具体涉及一种图像描述模型的训练方法及系统、图像描述的生成方法,该训练方法包括:将目标图像输入图像特征提取器提取网格特征和区域特征;在编码器的每一层,将网格特征和区域特征融合后进行编码,得到最终编码;将最终编码输入解码器进行解码,得到目标图像的图像描述;根据预定义的损失函数对所述图像描述模型进行训练,直到达到预定的收敛标准。本发明可以有效地整合细粒度细节和粗粒度信息,弥补了网格特征和区域特征之间的差异,从而提高了生成的图像描述的准确度。