-
公开(公告)号:CN119537644B
公开(公告)日:2025-04-11
申请号:CN202510095596.6
申请日:2025-01-22
Applicant: 西北大学
IPC: G06F16/732 , G06F16/783 , G06V20/40 , G06V10/44 , G06V10/52 , G06V10/764 , G06V10/80
Abstract: 本申请涉及一种文本视频多模态融合的视频时刻检索方法,将文本特征和多尺度视频特征进行全局融合,得到全局偏移量;将文本特征和多尺度视频特征进行局部融合,得到局部偏移量;累加全局偏移量和局部偏移量,得到总的偏移量;根据总的偏移量确定每个候选时刻对应的时间片段;对所有的时间片段采用非极大值抑制方法进行处理,得到最终的时间片段,即为确定的文本查询信息在原始视频中对应的时间片段。本申请解决了现有技术忽略了全局特征融合与局部特征融合的问题,既能捕捉到文本与视频之间的全局语义一致性,同时能够在更细粒度的层次上进行融合,有效的提升了视频时刻检索的准确性。
-
公开(公告)号:CN119537644A
公开(公告)日:2025-02-28
申请号:CN202510095596.6
申请日:2025-01-22
Applicant: 西北大学
IPC: G06F16/732 , G06F16/783 , G06V20/40 , G06V10/44 , G06V10/52 , G06V10/764 , G06V10/80
Abstract: 本申请涉及一种文本视频多模态融合的视频时刻检索方法,将文本特征和多尺度视频特征进行全局融合,得到全局偏移量;将文本特征和多尺度视频特征进行局部融合,得到局部偏移量;累加全局偏移量和局部偏移量,得到总的偏移量;根据总的偏移量确定每个候选时刻对应的时间片段;对所有的时间片段采用非极大值抑制方法进行处理,得到最终的时间片段,即为确定的文本查询信息在原始视频中对应的时间片段。本申请解决了现有技术忽略了全局特征融合与局部特征融合的问题,既能捕捉到文本与视频之间的全局语义一致性,同时能够在更细粒度的层次上进行融合,有效的提升了视频时刻检索的准确性。
-
公开(公告)号:CN118710550A
公开(公告)日:2024-09-27
申请号:CN202410824378.7
申请日:2024-06-25
Applicant: 西北大学
IPC: G06T5/77 , G06N3/0464 , G06V10/44 , G06N3/084
Abstract: 本申请涉及一种基于局部光影感知的书法图像和谐化方法,该方法利用光影掩膜来区分图像中的参考区域和噪声区域,并屏蔽那些可能对和谐化造成干扰的区域,通过这种方式,能够更准确地捕捉到前景与背景之间的视觉风格差异,并只针对需要调整的部分进行和谐化处理;不仅能够避免不必要的干扰,还能有效提升图像和谐化的整体效果。
-
-