-
公开(公告)号:CN116452631A
公开(公告)日:2023-07-18
申请号:CN202310306107.8
申请日:2023-03-27
Applicant: 华侨大学
Abstract: 本发明涉及一种多目标跟踪方法、终端设备及存储介质,该方法中包括:读取视频信息;对视频信息中的帧图像进行目标分割,得到目标的像素级信息和表观特征信息;基于卡尔曼滤波算法对各帧图像中的轨迹进行预测;基于前一帧图像中的轨迹和当前帧图像中目标的表观特征信息,计算两者之间的外观相似度,提取外观相似度大于相似度阈值的轨迹和目标作为预匹配轨迹和预匹配目标,将预匹配目标存入匹配目标集;计算预匹配轨迹与预匹配目标之间的代价矩阵,计算未匹配轨迹与未匹配目标之间的Mask‑IoU分数,将两者融合得到最终代价矩阵;通过匈牙利算法得到轨迹匹配结果。本发明相比于现有方法可以兼具效率与性能。
-
公开(公告)号:CN116405683A
公开(公告)日:2023-07-07
申请号:CN202310449794.9
申请日:2023-04-24
Applicant: 华侨大学
IPC: H04N19/147 , H04N19/176 , H04N19/149 , H04N19/11 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于3D‑HEVC深度图模式预测的深度图编码方法、装置及可读介质,通过构建基于卷积网络的DMM模式预测模型并进行训练,得到经训练的DMM模式预测模型;将待编码深度图序列划分得到第一级别尺寸下的若干个当前待编码块,将当前待编码块输入经训练的DMM模式预测模型,输出的网络预测值为当前待编码块的编码过程中是否需要将DMM模式加入对应尺寸的全率失真代价计算列表的标签值;采用3D‑HEVC编码器对当前待编码块进行编码,在编码过程中调用网络预测值,并确定当前待编码块在对应尺寸下的最佳模式;以判断是否需要将DMM模式加入对应尺寸的全率失真代价计算列表,可避免直接将DMM模式加入全率失真代价计算列表,导致对DMM模式冗余的率失真计算过程。
-
公开(公告)号:CN115546251A
公开(公告)日:2022-12-30
申请号:CN202211279274.X
申请日:2022-10-19
Applicant: 华侨大学
Abstract: 本发明一种基于GIoU门限机制的在线多目标跟踪方法、设备和存储介质,提出一种加入到级联匹配过程的GIoU门限机制GIGM,以提高关联性能、解决长距离标识切换问题,当目标和检测距离较远时,GIGM可以有效防止匹配和长距离标识切换,CIoU匹配被用作第二关联策略,以获得更好和更合理的跟踪结果。即使检测目标在外观上高度相似,但当它们的位置相距很远时,GIGM可以防止该错误匹配。
-
公开(公告)号:CN115424168A
公开(公告)日:2022-12-02
申请号:CN202210975931.8
申请日:2022-08-15
Applicant: 华侨大学
Abstract: 本发明公开了一种基于自适应3D卷积的屏幕视频质量评价方法及装置,获取屏幕视频,基于局部视频活动度Γ(Px,y,t)对屏幕视频进行自适应分割,得到屏幕视频序列集合,屏幕视频包括参考屏幕视频和失真屏幕视频,屏幕视频序列集合包括参考屏幕视频序列集合和失真屏幕视频序列集合;通过3D卷积神经网络分别提取参考屏幕视频序列集合的参考时空卷积特征STr以及失真屏幕视频序列集合的失真时空卷积特征STd;采用双尺度卷积神经网络对参考时空卷积特征STr和失真时空卷积特征STd实现双通道时空特征融合,计算得到失真屏幕视频的质量评价分数。着重于考虑人眼视觉系统特性及屏幕视频本质信息,模拟人类视觉系统的多通道视觉处理过程,从不同角度实现对失真屏幕视频的质量预测。
-
公开(公告)号:CN114817596A
公开(公告)日:2022-07-29
申请号:CN202210390000.1
申请日:2022-04-14
Applicant: 华侨大学
IPC: G06F16/532 , G06F16/583 , G06V10/80 , G06V10/764 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明提出一种融合语义相似性嵌入和度量学习的跨模态图文检索方法,具体包括:首先构建特征嵌入模块抽取每个模态的深度特征,然后在图像和文本的单模态表征空间和跨模态公共表征空间通过标签域监督信息和语义一致性监督信息分别进行表征学习。同时,设计一个深度相似性度量网络对融合后的图像文本对进行相似性比较,得到相似性得分,通过语义相似性矩阵监督相似性学习。通过损失函数将模型统一到一个整体的框架内,训练可得到端到端的跨模态图文检索模型。通过实验表明,本发明能够有效解决跨模态图文检索中精确度不高的问题。
-
公开(公告)号:CN114710667A
公开(公告)日:2022-07-05
申请号:CN202210269314.6
申请日:2022-03-18
Applicant: 华侨大学
IPC: H04N19/107 , H04N19/11 , H04N19/96
Abstract: 本发明公开了一种针对H.266/VVC屏幕内容帧内CU划分的快速预测方法及装置,通过收集屏幕内容视频建立数据库,用于训练模型;构建宽度自适应网络模型,预测两种不同尺寸CU的划分方式,预测步骤如下:先采用网络模型对64×64大小的CU进行划分方式预测,若为不划分,则停止CU的RD代价计算,若为划分,则得到4个32×32大小的CU,则采用网络模型对32×32大小的CU的划分方式进行预测,若为不划分,则停止RD的代价计算,若为四叉树划分,则得到4个16×16的CU:若为多种类型叉树划分,则需要依靠标准编码器进行计算;最后设定适当的预设阈值来提高预测准确率。本发明能够在保持H.266/VVC编码效率的前提下,有效地降低H.266/VVC屏幕内容的帧内预测编码计算复杂度。
-
公开(公告)号:CN120075449A
公开(公告)日:2025-05-30
申请号:CN202510550540.5
申请日:2025-04-29
Applicant: 华侨大学
IPC: H04N19/172 , H04N19/51 , H04N19/85 , H04N19/91 , H04N19/139 , H04N19/42 , G06V20/40 , G06N3/0455 , G06N3/0464 , G06N3/08 , G06T7/269 , G06T7/00 , G06V10/80 , G06V10/82
Abstract: 本发明涉及视频压缩技术领域,公开了一种基于上下文的双目视频压缩方法,采用两个相同的通道分别逐帧处理左右视点的帧序列,得到左右视点的重建帧序列,组合成为压缩后的双目视频。两个通道均包括上下文生成单元和视频重建单元,上下文生成单元接收当前帧、运动参考帧和视差参考帧,得到最终上下文信息;视频重建单元接收当前帧和当前帧的最终上下文信息,获得重建帧;通过迭代的方式重建帧序列中的每一帧;左右视点的运动参考帧均为该视点上一时刻的重构帧,左视点的视差参考帧为右视点当前时刻的重构帧,右视点的视差参考帧为左视点当前时刻的运动上下文信息。本发明能够在保证视频质量的前提下,提高双目视频的压缩比。
-
公开(公告)号:CN120047434A
公开(公告)日:2025-05-27
申请号:CN202510505105.0
申请日:2025-04-22
Applicant: 华侨大学
IPC: G06T7/00 , G06V20/40 , G06V10/44 , G06V10/54 , G06V10/766 , G06V10/80 , G06V10/82 , G06N3/0442 , G06N3/045 , H04N17/00
Abstract: 本发明公开了基于视点时空相关性的沉浸式视频质量评价方法及装置,涉及视频图像处理技术领域,方法包括:获取包含多视点的纹理视频和深度视频的沉浸式视频,并从中提取出纹理视频块、深度视频块、纹理关键帧以及深度关键帧;将提取出的数据输入训练好的沉浸式视频质量评价模型中进行处理;模型包括纹理深度特征时空交互部分、纹理视频质量评价部分和深度视频质量评价部分;通过模型交互处理得到纹理视频分数和深度视频分数,对得分加权聚合得到最终的沉浸式视频质量评分。本发明通过获取并处理沉浸式视频中的多视点纹理和深度信息,实现了对沉浸式视频质量的评估。
-
公开(公告)号:CN119991973A
公开(公告)日:2025-05-13
申请号:CN202510480150.5
申请日:2025-04-17
Applicant: 华侨大学
IPC: G06T17/00
Abstract: 本发明公开了一种基于多尺度高斯球的动态场景重建方法及装置,涉及计算机视觉领域,包括:采用运动恢复结构算法对待重建的视频帧序列进行处理,生成稀疏点云,对稀疏点云进行初始化,生成3D高斯球集合;采用双域变形模型和自适应时间戳对3D高斯球集合进行处理,得到变形的3D高斯球集合;对变形的3D高斯球集合进行多尺度高斯处理,生成多尺度高斯球集合;对多尺度高斯球集合进行基于像素覆盖率的高斯筛选,得到优化后的多尺度高斯球集合;基于优化后的多尺度高斯球集合进行Alpha混合处理,重建得到抗锯齿动态渲染场景图像。本发明解决了目前动态场景重建的计算开销大且存在混叠效应等问题。
-
公开(公告)号:CN119359547B
公开(公告)日:2025-05-02
申请号:CN202411936474.7
申请日:2024-12-26
Applicant: 华侨大学
IPC: G06T3/4053 , G06N3/0464 , G06N3/0495 , G06T3/4046
Abstract: 本发明设计图像处理技术领域,公开了一种基于特征蒸馏和层间信息交互的轻量级图像超分辨率方法,包括以下步骤:构建动态非对称蒸馏模块和层间全维信息交互模块;基于动态非对称蒸馏模块和层间全维信息交互模块构建轻量级图像超分辨率网络;利用所述轻量级图像超分辨率网络实现图像超分辨率;其中,所述轻量级图像超分辨率网络利用卷积层对输入的低分辨率图像进行浅层特征提取,利用动态非对称蒸馏模块和层间全维信息交互模块对浅层特征进行深层特征提取,利用卷积层和上采样对深层特征进行图像重建,得到高分辨率图像。本发明以更轻量、更有效的方式提取关键特征,从而实现在提升重建效果的同时,最小化计算开销和参数量。
-
-
-
-
-
-
-
-
-