基于深度神经网络与级联回归的图像美感增强方法

    公开(公告)号:CN107392244A

    公开(公告)日:2017-11-24

    申请号:CN201710587701.3

    申请日:2017-07-18

    Applicant: 厦门大学

    Abstract: 本发明实施例提供一种基于深度神经网络与级联回归的图像美感增强方法,包括以下步骤:S1,提供尺寸为C0的原始图像,通过级联回归算法进行求解获得最小化目标;S2,通过AVA数据集与CHUKPQ数据集训练深度卷积神经网络的提取图像特征功能;S3,通过深度卷积神经网络提取深度特征xt,并通过深度卷积神经网络的空间金字塔池化层将尺寸为C0原始图像变转化为(2*2+3*3+4*4)*32的特征向量;S4,将提取的深度特征xt应用于随机蕨回归器中,并采用梯度下降方法学习获得基元回归器,通过级联回归器 来输出候选结果Cj(1≤j≤4);不断迭代直到误差不再减小,获得基元回归器的最小化目标函数;S5,将步骤S4中获得的基元回归器与深度特征xt按照迭代的方式进行T次循环,通过多级循环剪切获得最终裁剪图像。

    一种针对多结构数据的指导性采样方法

    公开(公告)号:CN107123119A

    公开(公告)日:2017-09-01

    申请号:CN201710287180.X

    申请日:2017-04-27

    Applicant: 厦门大学

    Abstract: 一种针对多结构数据的指导性采样方法,涉及计算机视觉技术。1)准备输入数据;2)如果当前总采样次数c小于M,那么执行步骤3)~7);否则,结束采样且输出模型假设集Θ;3)如果当前总采样次数c小于b,那么使用随机采样方法采样一个数据子集S;否则使用提出的指导性采样方法采样一个数据子集S;4)使用采样到的数据子集S估计一个模型假设θ;5)对每一个xi∈χ,计算xi与θ的绝对残差到;6)如果当前总采样次数c大于等于b且c是b的整数倍,那么更新窗口大小w且排序得到残差索引的重排列7)把模型假设添加到模型假设集中。

    基于多模型估计的面向移动摄像机的运动目标检测方法

    公开(公告)号:CN105975918A

    公开(公告)日:2016-09-28

    申请号:CN201610278401.2

    申请日:2016-04-29

    Applicant: 厦门大学

    Inventor: 王菡子 王兴 严严

    CPC classification number: G06K9/00758 G06K9/00751 G06K2209/21

    Abstract: 基于多模型估计的面向移动摄像机的运动目标检测方法,涉及计算机视觉技术。对输入视频图像序列预处理,并进行特征提取;从匹配对F中估计出第一个投影变换模型S1;从匹配对F中提取第二个投影变换模型S2;分别使用两个变换模型将S1,S2把前一帧Ik‑1投影到当前帧Ik并进行帧差,得到两个差分图d1和d2;将前一帧的检测结果Mk‑1作为置信区域,对d1和d2进行二值化得到两个二值化差分图mask1和mask2;将mask1和mask2进行逻辑与操作得到二值化图maskAndk,再进行形态学处理得到最终的检测结果Mk。

    一种新的人脸特征描述方法

    公开(公告)号:CN103455805A

    公开(公告)日:2013-12-18

    申请号:CN201310450629.1

    申请日:2013-09-27

    Applicant: 厦门大学

    Abstract: 一种新的人脸特征描述方法,涉及人脸识别。首先利用训练集对每幅图像建立差分图像集,其次将差分图像集中的每幅图像按照事先的规定提取LTPBP特征描述向量,然后按照约定的规则把LTPBP特征描述向量组合成10个不同的特征矩阵、利用LDA方法对生成的特征向量矩阵分别进行一次学习从而得到10个投影矩阵,再分别利用投影矩阵对原LTPBP特征描述向量进行投影学习得到降维后的LTPBP特征描述向量,最后把属于同一幅图像中得到的低维LTPBP特征描述向量串连起来生成PPC特征描述向量。提出与漂移差分方法相结合的LTPBP纹理特征描述向量,加速了特征提取的运算效率。

    一种人脸姿态检测方法与在人脸识别中的应用

    公开(公告)号:CN103268497A

    公开(公告)日:2013-08-28

    申请号:CN201310241306.1

    申请日:2013-06-18

    Applicant: 厦门大学

    Abstract: 一种人脸姿态检测方法与在人脸识别中的应用,涉及一种人脸识别。对训练集中的图像分类,通过训练集的HOG特征计算出对应于三种人脸姿态的姿态估计滤波器组,通过训练集的Gabor特征计算出对应于三种人脸姿态的识别滤波器组,根据测试图片的HOG特征判定图像中人脸的姿态方向并利用相应的识别滤波器组做识别。将人脸姿态分为三类:左侧、正面、右侧姿态人脸。分别提取三类人脸姿态的HOG和Gabor特征。用PCA分别对三类人脸姿态的HOG和Gabor特征去噪和降维。提取每类人脸的轮廓信息。提取测试图像的HOG特征并以此信息判定该测试人脸的姿态方向。根据测试人脸的姿态方向利用相应的Gabor滤波器组识别测试图像。

    基于同类目标融合数据增广的鲁棒X光图像目标检测方法

    公开(公告)号:CN118968075A

    公开(公告)日:2024-11-15

    申请号:CN202410996894.8

    申请日:2024-07-24

    Applicant: 厦门大学

    Abstract: 本发明公开了基于同类目标融合数据增广的鲁棒X光图像目标检测方法,本方案方法主要基于工作的数据集在标签含有噪声的情况,其可以有效地消除标签噪声对X光安检图像目标检测器训练产生的影响,并且通过图像融合很好的模拟了X光图像中重叠遮挡的情况,让模型可以更好的学习到X光图片的固有特征。该方案不仅在多个公开地数据集上都取得了良好的性能,同时相比于传统的噪声标签学习方法,本方案是一种更加灵活,且贴近实际需求地解决噪声标签情况下X光安检图像目标检测的方案。除此之外,通过实验结果发现,本方案方法不仅在X光数据集中有效,在一些通用目标检测数据集中也有较好的效果。

    一种基于双分支干扰分离网络的人脸表情识别方法

    公开(公告)号:CN113239833B

    公开(公告)日:2023-08-29

    申请号:CN202110551957.5

    申请日:2021-05-20

    Applicant: 厦门大学

    Abstract: 一种基于双分支干扰分离网络的人脸表情识别方法,涉及计算机视觉技术。提供可以处理表情图像中多种干扰因素的一种基于双分支干扰分离网络的人脸表情识别方法。首先设计一个双分支网络来分开学习表情特征和干扰特征,再根据干扰特征的不同类型在干扰分支中设计标签感知子分支和无标签子分支。在标签感知子分支中,利用辅助数据集的标签信息和迁移学习的方式学习常见干扰特征。在无标签子分支中,引入印度自助餐过程理论学习潜在干扰特征。最后,通过对抗学习,进一步分离干扰特征和表情特征,从而获得更有判别力的表情特征进行分类预测,有效地提升表情识别的性能。

    基于阶段性特征语义对齐的实时街景图像语义分割方法

    公开(公告)号:CN113011429B

    公开(公告)日:2023-07-25

    申请号:CN202110295657.5

    申请日:2021-03-19

    Applicant: 厦门大学

    Inventor: 严严 翁熙 王菡子

    Abstract: 一种基于阶段性特征语义对齐的实时街景图像语义分割方法,涉及计算机视觉技术。首先利用轻量级图像分类网络ResNet‑18和高效空间‑通道注意力模块构建编码器,并使用多个不同设计的特征对齐模块模块与全局平均池化层构建解码器。接着,利用上述得到的编码器与解码器,构成基于编码器‑解码器网络结构的语义分割网络模型。最后将编码器中的特征与解码器的输出特征进行聚合并送入语义分割结果生成模块中,以得到最终的语义分割结果。在维持高分辨率的输入图像且不降低图像分辨率的情况下,能够以实时的速率高效地产生对应的分割结果。比起现有的实时语义分割方法,能够取得更加优秀的分割精度,在速度和精度之间取得更好的平衡。

    一种基于孪生网络的目标特定响应注意力目标跟踪方法

    公开(公告)号:CN111291679B

    公开(公告)日:2022-05-27

    申请号:CN202010081733.8

    申请日:2020-02-06

    Applicant: 厦门大学

    Abstract: 一种基于孪生网络的目标特定响应注意力目标跟踪方法,涉及计算机视觉技术。针对原有的基于孪生网络的目标跟踪方法对目标快速运动、遮挡、旋转、背景杂乱等复杂跟踪场景不够鲁棒的缺点,提出一种基于孪生网络的目标特定响应注意力目标跟踪方法,提出的目标响应注意力模块有效弱化跟踪过程中噪声信息对于跟踪性能的影响,同时强化对目标对象外观变化具有判别性的特征信息,使得孪生网络产生的比较好的目标响应图,使用该目标响应图进行目标位置预测,从而实现更鲁棒的跟踪性能。包含五个主要部分:CNN特征提取;逐通道互相关生成响应图;利用注意力网络产生权重,对各通道响应图加权;最终响应图上确定目标位置,以及所提出模型的训练方法。

    一种全局与局部特征融合的遮挡鲁棒行人重识别方法

    公开(公告)号:CN112200111B

    公开(公告)日:2022-05-17

    申请号:CN202011116582.1

    申请日:2020-10-19

    Applicant: 厦门大学

    Abstract: 一种全局与局部特征融合的遮挡鲁棒行人重识别方法,涉及计算机视觉技术。包括以下步骤:1)训练数据的准备;2)模型设计与训练;模型包括ResNet‑50骨架网络、全局分支、局部分支以及语义分支、全局分支利用SPC损失提取全局特征,局部分支提取局部特征,语义分支预测人体语义标签,三个分支可以联合在一起进行端到端的训练。3)利用训练好的模型来提取行人重识别数据训练集和测试集中所有行人图像的全局特征、局部特征以及预测行人图像的语义标签,并进行非遮挡区域指示符的计算。4)对查询集中的每幅行人图像分别与数据库中的所有行人图像计算相似度,按相似度从大到小排序,从而完成行人重识别。显著提高了识别的性能。

Patent Agency Ranking