-
公开(公告)号:CN116304145A
公开(公告)日:2023-06-23
申请号:CN202310298214.0
申请日:2023-03-24
Applicant: 厦门大学深圳研究院
IPC: G06F16/532 , G06F18/22 , G06V10/82 , G06V10/42 , G06V10/44 , G06F40/279 , G06N3/0464 , G06N3/0442 , G06N3/08
Abstract: 基于文本的人物检索的双向一对多嵌入对齐方法,涉及人物检索方法。1)使用预训练好的ResNet‑50主干网络提取图片特征,使用预训练好的BERT及可训练的Bi‑LSTM模型提取获取全局的视觉与文本特征;2)将视觉特征V均匀分割成K个不重叠部分,采用单词注意模块获得K个不同的文本特征,获取视觉局部特征与文本局部特征;3)建立非局部模块,基于余弦相似性得到非局部的视觉特征和语言特征;4)建立一种全新的双向一对多嵌入范式,具体分为双向嵌入和一对多嵌入两块功能;5)采用身份损失和复合排序损失,两者相加构造整体损失函数进行优化。模型能确定优化方向,同时解决图文对一对多的匹配问题。