基于多层次显式关系选择的文本指导图像分割方法

    公开(公告)号:CN112037239A

    公开(公告)日:2020-12-04

    申请号:CN202010882340.7

    申请日:2020-08-28

    Abstract: 本发明提供一种基于多层次显式关系选择的文本指导图像分割方法,从图像语义中的实体关系,多尺度文本等多角度多层次指导图像分割,使得该方法对于丰富复杂的语言描述也可得到准确的结果。该方法主要包括:特征提取、金字塔池化、空间实体关系捕捉和多层图文关系强化。使用卷积神经网络提取图片中的语义特征;通过增加不同大小箱的金字塔池化方法得到具有全局信息的图片特征;再通过自注意力机制获取图片空间上的实体与实体之间的关系,当句子中含有多个实体描述时,能够有效提高实体定位的准确性;最后通过不同尺度的自然语言文本向量循环增强图像与语言之间的联系,对前一步结果进行多次矫正,得到更具鲁棒性结果。

    基于多层次显式关系选择的文本指导图像分割方法

    公开(公告)号:CN112037239B

    公开(公告)日:2022-09-13

    申请号:CN202010882340.7

    申请日:2020-08-28

    Abstract: 本发明提供一种基于多层次显式关系选择的文本指导图像分割方法,从图像语义中的实体关系,多尺度文本等多角度多层次指导图像分割,使得该方法对于丰富复杂的语言描述也可得到准确的结果。该方法主要包括:特征提取、金字塔池化、空间实体关系捕捉和多层图文关系强化。使用卷积神经网络提取图片中的语义特征;通过增加不同大小箱的金字塔池化方法得到具有全局信息的图片特征;再通过自注意力机制获取图片空间上的实体与实体之间的关系,当句子中含有多个实体描述时,能够有效提高实体定位的准确性;最后通过不同尺度的自然语言文本向量循环增强图像与语言之间的联系,对前一步结果进行多次矫正,得到更具鲁棒性结果。

Patent Agency Ranking