-
公开(公告)号:CN119988676A
公开(公告)日:2025-05-13
申请号:CN202510164149.1
申请日:2025-02-14
Applicant: 东北大学
IPC: G06F16/783 , G06F16/78 , G06F16/732 , G06V20/40 , G06V10/74 , G06N3/048 , G06N3/045 , G06N3/08
Abstract: 本发明提供一种基于改进细粒度对齐的视频文本检索方法和系统,涉及视频文本检索技术领域。本发明引入了文本引导的对象‑文本对齐(TOTAL)模块,该模块创新性地将文本与从视频帧中提取的对象进行对齐,显著提升了性能。为了解决视频中存在贡献程度低的帧的问题,提出了相似度帧聚合(SIFA)模块,通过为视频中的对象‑文本对齐帧分配权重,从而提升视频的检索的精度,解决现有的视频文本检索方法中的细粒度对齐的缺陷。