-
公开(公告)号:CN117709454A
公开(公告)日:2024-03-15
申请号:CN202311823118.X
申请日:2023-12-27
Applicant: 西安交通大学
IPC: G06N5/022 , G06N5/04 , G06N3/0455 , G06N3/096 , G06V20/70 , G06V20/00 , G06V10/25 , G06V10/82 , G06V10/774
Abstract: 本发明公开了一种基于生成式模板的无偏场景图构造方法、系统和设备,获取待检测的丰富场景下的不同图像;采用深度学习模型提取丰富场景下的不同图像的上下文特征;根据不同图像的上下文特征,通过深度学习模型中的Transformer块推断不同图像中存在的语义信息,不同图像中存在的语义信息包括目标物体的分类和目标之间信度得分;按照置信度得分高低输出图像三元组预测结果;所述深度学习模型为通过Transformer编码器‑解码器网络架构提取图像的视觉上下文特征,进行数据增强后,对深度神经网络进行训练得到的。本发明在公开场景图数据集VG上进行大量的实验证实,可以有效的构造符合图像内容的场景图。