-
公开(公告)号:CN118609034B
公开(公告)日:2024-10-15
申请号:CN202411080625.3
申请日:2024-08-08
Applicant: 华侨大学 , 厦门松霖科技股份有限公司
Abstract: 本发明公开了一种基于帧级时间聚合策略的沉浸式视频质量评价方法及装置,涉及视频处理领域,方法包括:通过帧抽样策略去除视频冗余信息,采用卷积网络对沉浸式视频(即多视点纹理加深度视频)不同区域进行多尺度特征提取;接着使用注意力模型对特征进行加权,通过帧级时间聚合策略自适应地筛选沿时间维度的质量分数;最终结合六自由度(Degree of Freedom,DoF)时空轨迹权重获取失真沉浸式视频质量分数。本发明具有较好的沉浸式视频质量评价效果,稳定性和鲁棒性高。
-
公开(公告)号:CN118334711B
公开(公告)日:2024-08-27
申请号:CN202410757573.2
申请日:2024-06-13
Applicant: 华侨大学 , 厦门松霖科技股份有限公司
IPC: G06V40/10 , G06N3/0455 , G06N3/0464 , G06T7/70 , G06V10/26 , G06V10/764 , G06V10/82
Abstract: 本发明公开了一种基于服装描述生成的行人性别与年龄识别方法及装置,涉及图像识别领域,包括:构建行人性别与年龄识别模型,通过线性映射层和前a层Transformer块将行人图像处理为识别特征和图像特征,利用人体部位检测模型获取行人图像中的人体部位的位置,并裁剪出各个人体部位图像,利用图像字幕生成模型生成各个人体部位图像对应的服装文字描述,并利用词嵌入模型将服装文字描述映射为服装文字描述向量,将服装文字描述向量输入特征提取模块,提取得到对应的向量特征,将所有向量特征拼接后再连接至识别特征和图像特征后,并依次经过后b层Transformer块、第一全连接层和Softmax函数层,得到识别结果,解决性别与年龄识别技术受观察角度与环境等因素影响较大的问题。
-
公开(公告)号:CN118101938B
公开(公告)日:2024-06-25
申请号:CN202410497734.9
申请日:2024-04-24
Applicant: 华侨大学
IPC: H04N19/119 , H04N19/154
Abstract: 本发明公开了一种基于感兴趣区域的VVC码率控制方法及装置,涉及视频编码领域,方法包括:使用基于残差SSD网络训练的人脸检测模型检测图像中的人脸区域作为ROI;使用斯塔克尔伯格模型对ROI的失真进行建模,并采用二分法求解ROI的目标比特;计算编码图像的JND图作为空域视觉敏感度,对8x8互不重叠的子块进行运动估计,得到时域视觉敏感度;将有约束问题转化为无约束问题,并采用KKT条件进行最优化求解,得到最优拉格朗日乘子用于进行比特分配。本发明考虑视频会议、视频监控等应用对ROI的需求增长,人眼对ROI区域重点关注,提取空时域感知敏感度,对ROI和nROI的比特分配问题分别建模并进行最优化求解,合理进行比特分配。
-
公开(公告)号:CN111160226B
公开(公告)日:2023-03-31
申请号:CN201911370041.9
申请日:2019-12-26
Applicant: 华侨大学
IPC: G06V40/10 , G06V10/764 , G06V10/82 , G06V10/77 , G06N3/0464 , G06N3/048 , G06N3/084
Abstract: 本发明涉及一种基于视角自适应特征学习的行人性别识别方法包括:视角自适应训练过程,性别识别过程。本发明利用输入行人的视角信息来指导卷积神经网络的特征学习过程,以减轻行人视角变化对神经网络进行性别识别的影响,使训练得到的网络模型具有更加准确的行人性别识别效果。本发明结合了行人的视角信息,解决了以往基于卷积神经网络用在行人性别识别问题上的不足,有效地提高了行人性别识别精度。本发明可以被广泛地应用在智能视频监控场景,例如大型商场,机场,火车站等。
-
公开(公告)号:CN111160226A
公开(公告)日:2020-05-15
申请号:CN201911370041.9
申请日:2019-12-26
Applicant: 华侨大学
Abstract: 本发明涉及一种基于视角自适应特征学习的行人性别识别方法包括:视角自适应训练过程,性别识别过程。本发明利用输入行人的视角信息来指导卷积神经网络的特征学习过程,以减轻行人视角变化对神经网络进行性别识别的影响,使训练得到的网络模型具有更加准确的行人性别识别效果。本发明结合了行人的视角信息,解决了以往基于卷积神经网络用在行人性别识别问题上的不足,有效地提高了行人性别识别精度。本发明可以被广泛地应用在智能视频监控场景,例如大型商场,机场,火车站等。
-
公开(公告)号:CN120075449A
公开(公告)日:2025-05-30
申请号:CN202510550540.5
申请日:2025-04-29
Applicant: 华侨大学
IPC: H04N19/172 , H04N19/51 , H04N19/85 , H04N19/91 , H04N19/139 , H04N19/42 , G06V20/40 , G06N3/0455 , G06N3/0464 , G06N3/08 , G06T7/269 , G06T7/00 , G06V10/80 , G06V10/82
Abstract: 本发明涉及视频压缩技术领域,公开了一种基于上下文的双目视频压缩方法,采用两个相同的通道分别逐帧处理左右视点的帧序列,得到左右视点的重建帧序列,组合成为压缩后的双目视频。两个通道均包括上下文生成单元和视频重建单元,上下文生成单元接收当前帧、运动参考帧和视差参考帧,得到最终上下文信息;视频重建单元接收当前帧和当前帧的最终上下文信息,获得重建帧;通过迭代的方式重建帧序列中的每一帧;左右视点的运动参考帧均为该视点上一时刻的重构帧,左视点的视差参考帧为右视点当前时刻的重构帧,右视点的视差参考帧为左视点当前时刻的运动上下文信息。本发明能够在保证视频质量的前提下,提高双目视频的压缩比。
-
公开(公告)号:CN119991973A
公开(公告)日:2025-05-13
申请号:CN202510480150.5
申请日:2025-04-17
Applicant: 华侨大学
IPC: G06T17/00
Abstract: 本发明公开了一种基于多尺度高斯球的动态场景重建方法及装置,涉及计算机视觉领域,包括:采用运动恢复结构算法对待重建的视频帧序列进行处理,生成稀疏点云,对稀疏点云进行初始化,生成3D高斯球集合;采用双域变形模型和自适应时间戳对3D高斯球集合进行处理,得到变形的3D高斯球集合;对变形的3D高斯球集合进行多尺度高斯处理,生成多尺度高斯球集合;对多尺度高斯球集合进行基于像素覆盖率的高斯筛选,得到优化后的多尺度高斯球集合;基于优化后的多尺度高斯球集合进行Alpha混合处理,重建得到抗锯齿动态渲染场景图像。本发明解决了目前动态场景重建的计算开销大且存在混叠效应等问题。
-
公开(公告)号:CN119561791B
公开(公告)日:2025-04-22
申请号:CN202510114211.6
申请日:2025-01-24
Applicant: 华侨大学
IPC: H04L9/40 , G06N3/0455 , G06F18/2433
Abstract: 本发明涉及入侵流量检测领域,公开了一种基于宽度网络的集成单分类异常流量检测方法及系统,方法包括如下步骤:采样步骤,根据采样概率抽取一定比例的正常数据;训练步骤,利用所述正常数据训练宽度自编码网络,作为弱分类器;更新步骤,根据样本重构误差计算当前弱分类器的置信度,并更新样本的采样概率;集成步骤,重复采样步骤至更新步骤,直到获得若干个弱分类器,集成获得异常流量检测模型;检测步骤,利用异常流量检测模型对未知样本进行异常检测,得到多个弱分类器的异常检测结果,根据弱分类的置信度对异常检测结果加权得到最终的检测结果。本发明将宽度学习自编码网络应用在单分类问题,解决了深度网络训练慢、消耗内存大等问题。
-
公开(公告)号:CN119741304A
公开(公告)日:2025-04-01
申请号:CN202510262624.9
申请日:2025-03-06
Applicant: 华侨大学 , 厦门松霖科技股份有限公司
Abstract: 本发明公开了一种基于三维人脸几何结构的无参考质量评估方法及装置,涉及计算机视觉领域,方法包括:三维人脸网格模型重建;计算映射关键点和提取关键点之间的欧几里得距离,获得几何一致性分数;用三维人脸分割算法划分人脸区域,计算高斯曲率得到区域曲率分数;计算模型表面的平滑度,检测模型表面是否存在不自然的突起或瑕疵,获得平滑度分数;将几何一致性分数、区域曲率分数和平滑度分数按照加权比例进行融合,输出三维人脸网格模型的综合质量分数。本发明无需依赖数据库中的标准人脸模型,能够基于人脸几何特征和区域性分析对单个重建的三维人脸网格模型质量进行全面评估,适用于智能美容、精准医疗等个性化重建场景。
-
公开(公告)号:CN119561791A
公开(公告)日:2025-03-04
申请号:CN202510114211.6
申请日:2025-01-24
Applicant: 华侨大学
IPC: H04L9/40 , G06N3/0455 , G06F18/2433
Abstract: 本发明涉及入侵流量检测领域,公开了一种基于宽度网络的集成单分类异常流量检测方法及系统,方法包括如下步骤:采样步骤,根据采样概率抽取一定比例的正常数据;训练步骤,利用所述正常数据训练宽度自编码网络,作为弱分类器;更新步骤,根据样本重构误差计算当前弱分类器的置信度,并更新样本的采样概率;集成步骤,重复采样步骤至更新步骤,直到获得若干个弱分类器,集成获得异常流量检测模型;检测步骤,利用异常流量检测模型对未知样本进行异常检测,得到多个弱分类器的异常检测结果,根据弱分类的置信度对异常检测结果加权得到最终的检测结果。本发明将宽度学习自编码网络应用在单分类问题,解决了深度网络训练慢、消耗内存大等问题。
-
-
-
-
-
-
-
-
-