-
公开(公告)号:CN117975090A
公开(公告)日:2024-05-03
申请号:CN202311650341.9
申请日:2023-12-04
Applicant: 安徽大学
IPC: G06V10/764 , G06V10/25 , G06N3/0464 , G06N3/045 , G06V10/82 , G06V10/44 , G06V10/77 , G06N3/08 , G06N5/04
Abstract: 本发明公开了一种基于智能感知的人物交互检测方法,包括以下步骤:设置交互建议分支,通过交互建议网络获得更高质量的交互建议,通过交互结构部件获得交互间语义信息与交互内部位置信息;网络流程上,骨干网络提取全局上下文信息的视觉特征序列,将特征序列送入交互建议分支与交互预测分支;交互建议分支获取高质量交互建议,将其作为交互预测分支的查询,结合交互动作类别分支来预测最终的HOI三元组。本发明通过交互结构与交互类别两个方面获取交互信息,并且通过修改解码器高效的利用交互信息增强交互理解,交互类别上引入CLIP进行辅助判别;在HICO‑Det与V‑COCO基准上进行了大量的实验,证明了设计的有效性。