-
公开(公告)号:CN106954057A
公开(公告)日:2017-07-14
申请号:CN201710109136.X
申请日:2017-02-27
Applicant: 华侨大学
IPC: H04N13/00 , H04N19/105 , H04N19/172 , H04N19/20
CPC classification number: H04N19/103 , H04N13/10 , H04N19/105 , H04N19/172 , H04N19/20
Abstract: 本发明涉及一种基于视点间相关性的3D‑HEVC帧间预测快速模式选择方法,属于视频编码领域,方法包括记录输入视频独立视点SKIP模式标志;查询非独立视点编码单元在独立视点中的对应位置;通过对应位置和相邻位置SKIP模式标志确定非独立视点中编码单元的最佳模式。本发明一种基于视点间相关性的3D‑HEVC帧间预测快速模式选择方法能够减少编码器的计算开销,在保持编码性能不变的情况下,减少编码时间。
-
公开(公告)号:CN106303521A
公开(公告)日:2017-01-04
申请号:CN201610668684.1
申请日:2016-08-15
Applicant: 华侨大学
IPC: H04N19/105 , H04N19/114 , H04N19/115 , H04N19/147 , H04N19/176
CPC classification number: H04N19/105 , H04N19/114 , H04N19/115 , H04N19/147 , H04N19/176
Abstract: 本发明公开了一种基于感知敏感度的HEVC率失真优化方法,属于视频编码领域,方法包括:获取输入视频各编码块的梯度幅值方差,根据各编码块的梯度幅值方差计算当前帧的梯度幅值方差;有效利用各编码块和当前帧的梯度幅值方差关系计算各编码块的感知敏感度;并根据各编码块感知敏感度获取感知自适应的拉格朗日乘子;由所述拉格朗日乘子计算视频编码中的各编码块的率失真代价,从而确定其最佳编码模式。本发明能够提升编码器整体感知性能,在消耗相同码率的情况下,获得更高感知质量的编码视频。
-
公开(公告)号:CN120075476A
公开(公告)日:2025-05-30
申请号:CN202510541659.6
申请日:2025-04-28
Applicant: 华侨大学
IPC: H04N19/96 , H04N19/597 , H04N19/85 , G06T9/40 , G06N3/0455
Abstract: 本发明公开了一种基于多尺度八叉树注意力机制的点云压缩方法及装置,涉及图像处理领域,包括:编码器网络接收点云数据,利用降尺度特征提取器对点云进行下采样和特征提取,获得降尺度的深层特征点云,通过递归方式将其编码为八叉树,并根据八叉树节点之间的关系构建上下文窗口,引入多头注意力机制对八叉树节点进行特征融合,得到八叉树节点的占用概率,再使用算术编码将其压缩为比特流;解码器网络通过对比特流进行解压缩,获得重建后的点云,利用升尺度特征重建器对其进行上采样和特征重建,最终获得与初始点云相同分辨率的重建点云。本发明能够在保证相同点云质量的前提下,有效提高点云压缩的效率,减少比特开销。
-
公开(公告)号:CN120031869A
公开(公告)日:2025-05-23
申请号:CN202510495985.8
申请日:2025-04-21
Applicant: 华侨大学
Abstract: 本发明公开了基于深浅层时空特征的屏幕内容视频质量评价方法及装置,涉及视频评价领域,方法包括:获取屏幕内容视频并从中提取视频块和关键帧,构建包含空间特征提取支路、时间特征提取支路、空域时域融合模块和质量回归模块的双支路屏幕内容视频质量评价模型;通过将关键帧输入空间特征提取支路获得空间特征,视频块输入时间特征提取支路获得时间特征,两者拼接后经由空域时域融合模块整合,最终通过质量回归模块输出视频质量分数。本发明通过构建并训练包含空间和时间特征提取支路的双支路屏幕内容视频质量评价模型,实现了对屏幕内容视频质量的有效评估。
-
公开(公告)号:CN119863744A
公开(公告)日:2025-04-22
申请号:CN202510346077.2
申请日:2025-03-24
Applicant: 华侨大学
Abstract: 本发明一种基于六自由度信息引导的沉浸式视频质量评价方法及装置,涉及计算机视觉领域,方法包括:构建基于六自由度信息引导的沉浸式视频质量评价模型并训练,得到经训练的评价模型;从沉浸式视频提取纹理视频块、纹理关键帧和深度关键帧;将纹理视频块、纹理关键帧和深度关键帧输入经训练的评价模型,通过视觉信息编码模块提取到对应的视觉特征;将视觉特征输入时空映射模块得到时间视觉标记和空间视觉标记;通过语言编码器对指令信息和六自由度视点位置信息进行编码,得到文本指令标记和视点位置标记;将各标记进行组合得到组合标记,将组合标记输入语音解码器中,得到沉浸式视频质量分数。本发明能够准确客观评估沉浸式视频的质量。
-
公开(公告)号:CN119339084B
公开(公告)日:2025-03-25
申请号:CN202411836240.5
申请日:2024-12-13
Applicant: 华侨大学 , 泉州圣源警用侦察设备有限公司
IPC: G06V10/26 , G06V10/764
Abstract: 本发明公开了一种基于区块类别编码的电缆图像分割方法及装置,涉及图像处理领域,包括:构建电缆图像分割模型和区块编码模块,将电缆分割训练数据中的图像数据输入到语义分割编码器,得到区块特征,将区块特征输入到语义分割解码器,得到语义类别概率,基于语义类别概率和语义类别标签构建语义分割损失函数,将语义类别标签输入到区块编码模块,得到区块类别标签,基于语义类别概率和区块类别标签构建相关性匹配损失函数,并计算得到总损失函数,基于总损失函数对电缆图像分割模型进行训练,得到经训练的电缆图像分割模型;利用经训练的电缆图像分割模型进行图像分割。本发明解决目前电缆图像分割技术中分割不完整、准确率低的问题。
-
公开(公告)号:CN119299671B
公开(公告)日:2025-02-21
申请号:CN202411815010.0
申请日:2024-12-11
Applicant: 华侨大学
IPC: H04N19/103 , H04N19/96 , H04N19/119 , H04N19/126 , H04N19/127 , G06N3/0455 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于多阶段不规则编码单元划分的VVC‑SCC帧内编码方法及装置,涉及视频编码领域,包括:设计并训练基于多阶段卷积神经网络的编码单元划分预测模型;其次将输入的视频帧通过经训练的编码单元划分预测模型进行编码单元划分预测模型预测,输出当前帧所有CU的模式类型的预测概率;最后为不同的模式类别设置不同的阈值,根据预测概率和对应的阈值指导VVC‑SCC编码器进行编码,从而跳过不必要的模式类别的遍历。本发明解决现有的VVC‑SCC帧内编码方法编码时间长、编码器计算的复杂度高的问题。
-
公开(公告)号:CN119228788B
公开(公告)日:2025-02-18
申请号:CN202411725027.7
申请日:2024-11-28
Applicant: 华侨大学
IPC: G06T7/00 , G06N3/0455 , G06N3/08 , G06V10/26 , G06V10/40 , G06V10/764 , G06V10/82 , G01R31/12 , G01N21/88
Abstract: 本发明公开了一种基于类别余弦映射的绝缘子故障检测方法及装置,涉及人工智能、机器视觉领域,包括:从真实数据集合与合成数据集合中获取图像数据、故障标签以及类别标签;利用类别余弦偏置编码将类别偏置编码进图像数据,利用特征提取网络提取编码结果中的空间特征;利用类别余弦偏置解码缓解空间特征中的偏置信息以获得类别特征,利用多标签分类器获取类别特征与类别标签的分类损失;利用分割解码器获取空间特征与故障标签的掩码损失;基于分类损失与掩码损失完成模型训练。本发明将正常、故障绝缘子以及合成图像的类别差异通过余弦偏置编码至图像数据中,引导模型理解合成图像与真实场景中的分布差异,最终提升合成数据在实践中的有效性。
-
公开(公告)号:CN119229130B
公开(公告)日:2025-02-14
申请号:CN202411736952.X
申请日:2024-11-29
Applicant: 华侨大学
IPC: G06V10/26 , G06N3/0464 , G06V10/44 , G06V10/764 , G06V10/774 , G06V10/82
Abstract: 本发明公开了一种基于分类激活映射自举的路面裂痕分割方法及装置,涉及人工智能、机器视觉领域,方法包括:训练基于深度网络的正常与裂痕路面分类模型;利用类激活映射方法生成路面图像的激活映射图,通过高激活阈值筛选出类别高激活掩码并进行增强操作后,加入路面图像训练集;重复上述步骤,直到达到设定条件;基于训练好的正常与裂痕路面分类模型生成待推理的路面图像的激活映射图,通过裂痕掩码阈值获得待推理的路面图像的裂痕掩码,作为裂痕分割结果。本发明利用分类模型与激活映射,寻找类别高激活掩码更新路面图像训练集,不断迭代优化掩码效果,以改善路面裂痕分割效果,无需对裂痕进行像素级的标注,大大降低了标注成本。
-
公开(公告)号:CN119339084A
公开(公告)日:2025-01-21
申请号:CN202411836240.5
申请日:2024-12-13
Applicant: 华侨大学 , 泉州圣源警用侦察设备有限公司
IPC: G06V10/26 , G06V10/764
Abstract: 本发明公开了一种基于区块类别编码的电缆图像分割方法及装置,涉及图像处理领域,包括:构建电缆图像分割模型和区块编码模块,将电缆分割训练数据中的图像数据输入到语义分割编码器,得到区块特征,将区块特征输入到语义分割解码器,得到语义类别概率,基于语义类别概率和语义类别标签构建语义分割损失函数,将语义类别标签输入到区块编码模块,得到区块类别标签,基于语义类别概率和区块类别标签构建相关性匹配损失函数,并计算得到总损失函数,基于总损失函数对电缆图像分割模型进行训练,得到经训练的电缆图像分割模型;利用经训练的电缆图像分割模型进行图像分割。本发明解决目前电缆图像分割技术中分割不完整、准确率低的问题。
-
-
-
-
-
-
-
-
-