一种基于实体级跨模态交互的多模态命名实体识别方法

    公开(公告)号:CN115796182A

    公开(公告)日:2023-03-14

    申请号:CN202211486444.1

    申请日:2022-11-24

    Abstract: 本发明提供了一种基于实体级跨模态交互的多模态命名实体识别方法,引入实体范围检测作为辅助任务,以抽取实体特征作为文本和视觉模态信息交互的桥梁,同时,提出了一种基于异构图的实体级跨模态交互网络来挖掘视觉模态中的实体信息,增强文本特征,从而应对多模态命名实体识别任务的特有挑战,并提高多模态命名实体识别的性能;通过使用包含完整语义信息的实体特征与目标特征交互,实现更高效地捕获实体相关视觉信息,提高多模态命名实体识别的准确率;通过将非实体词元排除到跨模态交互过程外,保护非实体词元免受视觉模态噪声的干扰,减少图像噪声干扰导致非实体词元误识别为实体的错误情况发生。

Patent Agency Ranking