-
公开(公告)号:CN118115915A
公开(公告)日:2024-05-31
申请号:CN202410220485.9
申请日:2024-02-28
Applicant: 西安工程大学
IPC: G06V20/40 , G06V20/70 , G06V10/82 , G06V10/80 , G06V10/766 , G06N3/0442 , G06N3/09
Abstract: 本发明公开了基于语义类别感知的多尺度视频质量评价方法,具体包括如下过程:首先将视频帧以及视频帧分块作为相对应的数据,形成有约束关系的全局‑局部多尺度特征,利用GRU网络建立多尺度时间信息并同时捕捉短时和长时的时间依赖关系;使用伪标签生成策略得到视频中的语义类别信息,利用监督对比学习策略来学习与视频语义信息相关的语义类别感知特征,通过多任务框架实现局部空时信号表征空间与全局空间中视频语义信息的嵌入,在全局语义类别信息约束下,构建了具有局部‑全局关系约束的UGC‑VQA模型,从而实现多尺度评价视频的质量。该方法利用深度学习模型自动的评价UGC视频的质量,能够获得与人眼感官一致的视频评分。