-
公开(公告)号:CN119537644B
公开(公告)日:2025-04-11
申请号:CN202510095596.6
申请日:2025-01-22
Applicant: 西北大学
IPC: G06F16/732 , G06F16/783 , G06V20/40 , G06V10/44 , G06V10/52 , G06V10/764 , G06V10/80
Abstract: 本申请涉及一种文本视频多模态融合的视频时刻检索方法,将文本特征和多尺度视频特征进行全局融合,得到全局偏移量;将文本特征和多尺度视频特征进行局部融合,得到局部偏移量;累加全局偏移量和局部偏移量,得到总的偏移量;根据总的偏移量确定每个候选时刻对应的时间片段;对所有的时间片段采用非极大值抑制方法进行处理,得到最终的时间片段,即为确定的文本查询信息在原始视频中对应的时间片段。本申请解决了现有技术忽略了全局特征融合与局部特征融合的问题,既能捕捉到文本与视频之间的全局语义一致性,同时能够在更细粒度的层次上进行融合,有效的提升了视频时刻检索的准确性。
-
公开(公告)号:CN116823983A
公开(公告)日:2023-09-29
申请号:CN202310713460.8
申请日:2023-06-15
Applicant: 西北大学
IPC: G06T11/00 , G06N3/0475 , G06N3/0464 , G06N3/0455 , G06N3/094
Abstract: 本申请涉及一种基于风格收集机制的一对多风格书法图片生成方法,本申请在模型训练过程中,通过风格收集机制收集每一种字体的风格特征,构成风格编码参数集并保存;基于保存的风格编码参数集为生成对抗网络提供风格指引,帮助生成对抗网络生成与目标风格更加相似的汉字图片;与现有技术相比,模型可以同时生成多种风格字体,并且显著降低重新训练的工作量。
-
公开(公告)号:CN119537816A
公开(公告)日:2025-02-28
申请号:CN202510104203.3
申请日:2025-01-23
Applicant: 西北大学
IPC: G06F18/15 , G06F18/211 , G06F18/213 , G06N3/0442 , G06N3/045 , G06N3/0464 , G06N3/0475 , G06N3/08 , G06F123/02
Abstract: 本发明属于多元时间序列数据缺失值填补领域,公开了一种基于扩散模型的时间序列缺失值填补方法及系统,方法包括:步骤1,将时间序列数据集划分训练集、验证集和测试集,对每条时间序列数据进行数据处理,得到每条时间序列数据的01掩码矩阵,以及要填补的目标和可观测到的时间序列数据;步骤2,训练过程,得到训练好的去噪网络;步骤3,将测试集对应的前向加噪处理的结果输入步骤2得到的训练完成的去噪网络,输出反向去噪的结果,作为填补后的时间序列数据。本发明实现了噪声权重设置的灵活性,增强了模型对不同时序数据集的适用性和通用性。
-
公开(公告)号:CN119537644A
公开(公告)日:2025-02-28
申请号:CN202510095596.6
申请日:2025-01-22
Applicant: 西北大学
IPC: G06F16/732 , G06F16/783 , G06V20/40 , G06V10/44 , G06V10/52 , G06V10/764 , G06V10/80
Abstract: 本申请涉及一种文本视频多模态融合的视频时刻检索方法,将文本特征和多尺度视频特征进行全局融合,得到全局偏移量;将文本特征和多尺度视频特征进行局部融合,得到局部偏移量;累加全局偏移量和局部偏移量,得到总的偏移量;根据总的偏移量确定每个候选时刻对应的时间片段;对所有的时间片段采用非极大值抑制方法进行处理,得到最终的时间片段,即为确定的文本查询信息在原始视频中对应的时间片段。本申请解决了现有技术忽略了全局特征融合与局部特征融合的问题,既能捕捉到文本与视频之间的全局语义一致性,同时能够在更细粒度的层次上进行融合,有效的提升了视频时刻检索的准确性。
-
-
-