-
公开(公告)号:CN119917694A
公开(公告)日:2025-05-02
申请号:CN202411693245.7
申请日:2024-11-25
Applicant: 苏州大学
IPC: G06F16/783 , G06F16/75 , G06F16/71 , G06F16/738 , G06V10/764
Abstract: 本发明涉及多模态数据检索和跨模态对比学习技术领域,公开了一种多标签提取和预筛选文本到视频的检索方法及系统,包括:从文本和视频数据中提取标签,生成标签集,并对标签集进行筛选;对视频库中的视频和输入文本进行特征提取,生成视频和文本的多标签概率分布;构建标签至视频ID的倒排索引,并将生成的多标签概率分布与倒排索引中的标签进行匹配;根据输入文本标签集的匹配结果,匹配的相关视频。通过多标签提取和预筛选框架,将视频和文本数据转换为离散的语义标签,并结合倒排索引技术,实现了快速标签匹配和视频预筛选,有效降低了计算复杂度。