一种基于多交叉注意力的视频与字幕片段检索方法

    公开(公告)号:CN114429119B

    公开(公告)日:2024-05-28

    申请号:CN202210054069.7

    申请日:2022-01-18

    Applicant: 重庆大学

    Abstract: 本发明公开了一种基于多交叉注意力的视频与字幕片段检索方法,包括得到给定视频V的特征矩阵Ev;提取查询语句对应的特征矩阵Eq和V所对应字幕的特征矩阵Es;计算Eq与Ev,Eq与Es之间的关联关系,得到#imgabs0#和#imgabs1#将#imgabs2#和#imgabs3#转化为q(v)和q(s);计算最终每个片段与查询语句之间的匹配度;训练前述模型,将新视频数据输入训练后的模型得到概率Pst和Ped,根据Pst和Ped中概率值的大小排序,找出Pst和Ped的值均大的N个片段作为查找的片段。该方法既能处理多个模态数据之间的关系,又可以实现双向注意力引导,从而保证先进的视频‑片段检索性能。

    基于物体回归前后分类一致性的物体检测主动学习方法

    公开(公告)号:CN117372822A

    公开(公告)日:2024-01-09

    申请号:CN202311382599.5

    申请日:2023-10-24

    Applicant: 重庆大学

    Abstract: 本发明公开了一种基于物体回归前后分类一致性的物体检测主动学习方法。包括根据阈值筛选合适的边界框;由边界框坐标生成图像的方法;两次分类结果之间差异的比较;根据两次分类的结果计算物体的一致性得分;根据物体的一致性得分计算物体的不确定性;根据物体的不确定性计算图像的不确定性。该方法能够在同时考虑物体分类不确定性和定位不确定性的同时,不依赖于特定的网络结构或是额外的模块构建。

    一种基于多交叉注意力的视频与字幕片段检索方法

    公开(公告)号:CN114429119A

    公开(公告)日:2022-05-03

    申请号:CN202210054069.7

    申请日:2022-01-18

    Applicant: 重庆大学

    Abstract: 本发明公开了一种基于多交叉注意力的视频与字幕片段检索方法,包括得到给定视频V的特征矩阵Ev;提取查询语句对应的特征矩阵Eq和V所对应字幕的特征矩阵Es;计算Eq与Ev,Eq与Es之间的关联关系,得到和将和转化为q(v)和q(s);计算最终每个片段与查询语句之间的匹配度;训练前述模型,将新视频数据输入训练后的模型得到概率Pst和Ped,根据Pst和Ped中概率值的大小排序,找出Pst和Ped的值均大的N个片段作为查找的片段。该方法既能处理多个模态数据之间的关系,又可以实现双向注意力引导,从而保证先进的视频‑片段检索性能。

Patent Agency Ranking