-
公开(公告)号:CN108737840A
公开(公告)日:2018-11-02
申请号:CN201810525043.X
申请日:2018-05-28
Applicant: 华侨大学
IPC: H04N19/593 , H04N13/161 , H04N13/128 , H04N13/106
Abstract: 本发明涉及一种基于深度图纹理特性的3D-HEVC帧内快速编码方法,方案简单可行,只需要在编码时利用灰度共生矩阵的特征值进行计算,并对相邻块模式进行获取,没有引入过多的额外计算复杂度。本发明充分利用了深度图纹理特征和预测模式之间的相关性:预测模式与深度纹理特征之间有着一定的相关性,某些预测模式只对具有特定纹理才具有较好的编码效果,本发明则充分利用了这一相关性。
-
公开(公告)号:CN105141953B
公开(公告)日:2018-05-25
申请号:CN201510464054.8
申请日:2015-07-31
Applicant: 华侨大学
IPC: H04N19/109 , H04N19/147
Abstract: 本发明一种适用于HEVC的快速帧间模式选择方法,在帧间编码时,对每个编码树单元,也就是最大编码单元,按模式对应的编码单元尺寸从大到小顺序逐级计算对应的模式的率失真代价,当后一模式的率失真代价大于前一模式的率失真代价时,则结束该编码单元的模式选择,取前一模式为该编码单元的最佳模式;本发明所提出的方法简单易行,能大大降低HEVC帧间编码的计算复杂度。
-
公开(公告)号:CN106954077A
公开(公告)日:2017-07-14
申请号:CN201710208697.5
申请日:2017-03-31
Applicant: 华侨大学
IPC: H04N19/96 , H04N19/124 , H04N19/182 , H04N19/132
Abstract: 本发明涉及一种基于结构特征的HEVC码率控制方法,1)提取视频的帧图像,计算帧图像的编码树单元的2×2区域降采集特征图;2)基于各编码树单元的降采集特征图,计算当前各编码树单元的结构强度;3)基于当前各编码树单元的结构强度,计算当前帧图像的结构强度;4)基于各编码树单元的结构强度与当前帧图像的结构强度,计算各编码树单元的码率分配比重;5)根据各编码树单元的码率分配比重计算各编码树单元的量化参数。本发明利用编码树单元降采样特征图的结构强度来表征编码树单元的结构强度,很好地反应该编码树单元的感知特性,准确引导目标码率分配,获得更符合人眼特性的编码视频。
-
公开(公告)号:CN105141953A
公开(公告)日:2015-12-09
申请号:CN201510464054.8
申请日:2015-07-31
Applicant: 华侨大学
IPC: H04N19/109 , H04N19/147
Abstract: 本发明一种适用于HEVC的快速帧间模式选择方法,在帧间编码时,对每个编码树单元,也就是最大编码单元,按模式对应的编码单元尺寸从大到小顺序逐级计算对应的模式的率失真代价,当后一模式的率失真代价大于前一模式的率失真代价时,则结束该编码单元的模式选择,取前一模式为该编码单元的最佳模式;本发明所提出的方法简单易行,能大大降低HEVC帧间编码的计算复杂度。
-
公开(公告)号:CN120075476A
公开(公告)日:2025-05-30
申请号:CN202510541659.6
申请日:2025-04-28
Applicant: 华侨大学
IPC: H04N19/96 , H04N19/597 , H04N19/85 , G06T9/40 , G06N3/0455
Abstract: 本发明公开了一种基于多尺度八叉树注意力机制的点云压缩方法及装置,涉及图像处理领域,包括:编码器网络接收点云数据,利用降尺度特征提取器对点云进行下采样和特征提取,获得降尺度的深层特征点云,通过递归方式将其编码为八叉树,并根据八叉树节点之间的关系构建上下文窗口,引入多头注意力机制对八叉树节点进行特征融合,得到八叉树节点的占用概率,再使用算术编码将其压缩为比特流;解码器网络通过对比特流进行解压缩,获得重建后的点云,利用升尺度特征重建器对其进行上采样和特征重建,最终获得与初始点云相同分辨率的重建点云。本发明能够在保证相同点云质量的前提下,有效提高点云压缩的效率,减少比特开销。
-
公开(公告)号:CN120031869A
公开(公告)日:2025-05-23
申请号:CN202510495985.8
申请日:2025-04-21
Applicant: 华侨大学
Abstract: 本发明公开了基于深浅层时空特征的屏幕内容视频质量评价方法及装置,涉及视频评价领域,方法包括:获取屏幕内容视频并从中提取视频块和关键帧,构建包含空间特征提取支路、时间特征提取支路、空域时域融合模块和质量回归模块的双支路屏幕内容视频质量评价模型;通过将关键帧输入空间特征提取支路获得空间特征,视频块输入时间特征提取支路获得时间特征,两者拼接后经由空域时域融合模块整合,最终通过质量回归模块输出视频质量分数。本发明通过构建并训练包含空间和时间特征提取支路的双支路屏幕内容视频质量评价模型,实现了对屏幕内容视频质量的有效评估。
-
公开(公告)号:CN119479047B
公开(公告)日:2025-04-29
申请号:CN202510066012.2
申请日:2025-01-16
Applicant: 华侨大学 , 厦门盈趣科技股份有限公司
IPC: G06V40/16 , G06N3/09 , G06V10/44 , G06V10/762 , G06V10/82
Abstract: 本发明涉及机器学习领域,公开了一种基于宽度学习的半监督多视图聚类集成方法及系统,方法包括以下步骤:构建一种可以依据多视图人脸图像数据进行特征处理的基于宽度学习的自编码器,用于对输入的人脸图像进行特征提取,并基于宽度学习计算不同节点特征的权重;结合基于宽度学习的自编码器和双向约束传播构建聚类集成模型;利用聚类集成模型实现多视图人脸图像的聚类集成。本发明利用宽度学习系统的性能优势进行多视图数据的聚类处理,得到兼具效率与性能的模型网络,引入了流型结构和成对约束,并且在共识过程中采用了约束传播,丰富样本信息,有效提升基于宽度学习的聚类集成网络模型的鲁棒性和准确性,因而在实际场景中更具适用性。
-
公开(公告)号:CN119444804B
公开(公告)日:2025-04-29
申请号:CN202510037837.1
申请日:2025-01-10
Applicant: 华侨大学
Abstract: 本发明涉及图像处理技术领域,提出了一种基于动态自适应和强化特征的多目标跟踪分割方法及系统,方法包括前处理步骤、外观代价计算步骤、预匹配步骤、运动代价计算步骤、正式匹配步骤、后处理步骤、重复步骤和可视化步骤。该方法通过具有动态自适应的数据关联对目标特征进行细化整合,以及利用基于掩码的注意力机制和基于四三角形变的掩码预测分别强化目标外观特征和运动信息,以能够在保持高跟踪精度的同时,实现快速运算和低成本运行,适用于更广泛的应用场景。
-
公开(公告)号:CN119863744A
公开(公告)日:2025-04-22
申请号:CN202510346077.2
申请日:2025-03-24
Applicant: 华侨大学
Abstract: 本发明一种基于六自由度信息引导的沉浸式视频质量评价方法及装置,涉及计算机视觉领域,方法包括:构建基于六自由度信息引导的沉浸式视频质量评价模型并训练,得到经训练的评价模型;从沉浸式视频提取纹理视频块、纹理关键帧和深度关键帧;将纹理视频块、纹理关键帧和深度关键帧输入经训练的评价模型,通过视觉信息编码模块提取到对应的视觉特征;将视觉特征输入时空映射模块得到时间视觉标记和空间视觉标记;通过语言编码器对指令信息和六自由度视点位置信息进行编码,得到文本指令标记和视点位置标记;将各标记进行组合得到组合标记,将组合标记输入语音解码器中,得到沉浸式视频质量分数。本发明能够准确客观评估沉浸式视频的质量。
-
公开(公告)号:CN119848794A
公开(公告)日:2025-04-18
申请号:CN202510340474.9
申请日:2025-03-21
Applicant: 华侨大学
IPC: G06F18/25 , G06N3/0442 , G06N3/045 , G06N3/0464 , G06N3/0499 , G06N3/082 , G06F18/213 , G06F18/2413 , G06F18/2415
Abstract: 本发明公开了一种基于分层交互对齐网络的多模态情感识别方法及装置,涉及数据处理领域,包括:构建多模态情感识别模型并利用层次表示分布对齐层对齐进行训练,得到经训练的多模态情感识别模型;获取目标域人群中的其中一个待识别人员的脑电数据与眼动数据对并输入到经训练的多模态情感识别模型,依次经过特征提取模块和分层自适应交互注意力模块,得到待识别人员对应的最终跨模态特征,待识别人员对应的最终跨模态特征和目标域数据对应的最终跨模态特征输入到少样本学习模块,得到待识别人员属于每个情感类别的概率值,选择概率值最大所对应的情感类别作为待识别人员的预测情感类别。本发明解决多模态情感识别中个体差异大、样本数量有限的问题。
-
-
-
-
-
-
-
-
-