Patent search ap:("西北大学") AND inv:"段佳顺" Page 1

1.

发明授权
一种文本视频多模态融合的视频时刻检索方法有权

公开(公告)号：CN119537644B

公开(公告)日：2025-04-11

申请号：CN202510095596.6

申请日：2025-01-22

Applicant: 西北大学

Inventor： 肖云 , 王宁 , 舒键 , 吕昊 , 程梦习 , 段佳顺 , 房鼎益 , 陈晓江

IPC: G06F16/732 , G06F16/783 , G06V20/40 , G06V10/44 , G06V10/52 , G06V10/764 , G06V10/80

Abstract: 本申请涉及一种文本视频多模态融合的视频时刻检索方法，将文本特征和多尺度视频特征进行全局融合，得到全局偏移量；将文本特征和多尺度视频特征进行局部融合，得到局部偏移量；累加全局偏移量和局部偏移量，得到总的偏移量；根据总的偏移量确定每个候选时刻对应的时间片段；对所有的时间片段采用非极大值抑制方法进行处理，得到最终的时间片段，即为确定的文本查询信息在原始视频中对应的时间片段。本申请解决了现有技术忽略了全局特征融合与局部特征融合的问题，既能捕捉到文本与视频之间的全局语义一致性，同时能够在更细粒度的层次上进行融合，有效的提升了视频时刻检索的准确性。

2.

发明公开
一种文本视频多模态融合的视频时刻检索方法有权

公开(公告)号：CN119537644A

公开(公告)日：2025-02-28

申请号：CN202510095596.6

申请日：2025-01-22

Applicant: 西北大学

Inventor： 肖云 , 王宁 , 舒键 , 吕昊 , 程梦习 , 段佳顺 , 房鼎益 , 陈晓江

IPC: G06F16/732 , G06F16/783 , G06V20/40 , G06V10/44 , G06V10/52 , G06V10/764 , G06V10/80

Abstract: 本申请涉及一种文本视频多模态融合的视频时刻检索方法，将文本特征和多尺度视频特征进行全局融合，得到全局偏移量；将文本特征和多尺度视频特征进行局部融合，得到局部偏移量；累加全局偏移量和局部偏移量，得到总的偏移量；根据总的偏移量确定每个候选时刻对应的时间片段；对所有的时间片段采用非极大值抑制方法进行处理，得到最终的时间片段，即为确定的文本查询信息在原始视频中对应的时间片段。本申请解决了现有技术忽略了全局特征融合与局部特征融合的问题，既能捕捉到文本与视频之间的全局语义一致性，同时能够在更细粒度的层次上进行融合，有效的提升了视频时刻检索的准确性。

3.

发明公开
基于局部光影感知的书法图像和谐化方法审中-实审

公开(公告)号：CN118710550A

公开(公告)日：2024-09-27

申请号：CN202410824378.7

申请日：2024-06-25

Applicant: 西北大学

Inventor： 肖云 , 董智强 , 段佳顺 , 周绿卿 , 陈晓江 , 房鼎益

IPC: G06T5/77 , G06N3/0464 , G06V10/44 , G06N3/084

Abstract: 本申请涉及一种基于局部光影感知的书法图像和谐化方法，该方法利用光影掩膜来区分图像中的参考区域和噪声区域，并屏蔽那些可能对和谐化造成干扰的区域，通过这种方式，能够更准确地捕捉到前景与背景之间的视觉风格差异，并只针对需要调整的部分进行和谐化处理；不仅能够避免不必要的干扰，还能有效提升图像和谐化的整体效果。

Patent Agency Ranking