-
公开(公告)号:CN118674909A
公开(公告)日:2024-09-20
申请号:CN202410715006.0
申请日:2024-06-04
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于视觉问答模块和颜色掩码的同类物体识别方法,包括:使用者输入图像,对图像中的所有物体进行标注,获得所有物体的名称;指定出视觉问题的主体;在视觉问题中标注占位符;替换占位符得到新视觉问题;将视觉问题和图像输入到视觉问答模块来获得候选答案;使用不同颜色对候选答案进行上色;将带有颜色的物体名称对视觉问题的占位符再次进行替换,再次得到新的视觉问题;将最新的视觉问题和被上色的图像输入到视觉问答模块中,得到视觉问题的最终答案。本发明能够有效区分识别场景中属于同一类别的物体。