基于自适应表观模型和点‑集距离度量学习的目标跟踪方法

    公开(公告)号:CN104616324B

    公开(公告)日:2017-07-28

    申请号:CN201510099974.4

    申请日:2015-03-06

    Applicant: 厦门大学

    Inventor: 王菡子 王军

    Abstract: 基于自适应表观模型和点‑集距离度量学习的目标跟踪方法,涉及计算机视觉技术。首先利用收集到的目标模板和由这些目标模板的正则化仿射组合进行目标表示,同时学习一个点‑集距离度量矩阵,并将该点‑集距离度量矩阵整合在表观模型建立过程中,在粒子滤波框架下进行目标跟踪。根据一个生成式跟踪算法,给出一个基于目标模板集和正则化仿射包的自适应目标表观模型。该正则化仿射包由模板集中的目标模板的仿射连接生成。同时,学习一个点‑集距离度量矩阵,并整合该矩阵在目标表示优化过程中,从而获得一个自适应的目标表观模型。在线学习的点‑集距离度量用来测量一个目标候选块与目标模板集之间的距离。具有很好的跟踪效果和鲁棒性。

    一种静止摄像机下的基于ViBe的运动目标检测方法

    公开(公告)号:CN106683062A

    公开(公告)日:2017-05-17

    申请号:CN201710018297.8

    申请日:2017-01-10

    Applicant: 厦门大学

    Inventor: 王菡子 廖健 严严

    CPC classification number: G06T5/002

    Abstract: 一种静止摄像机下的基于ViBe的运动目标检测方法,A初始化视频帧每个像素点前景计数和鬼影计数。B对二值图预处理。C对二值图进行前景区块划分,去除像素少的前景区块并修改前景计数。D每隔p帧对C中得到的前景计数去噪再鬼影检测。E对经C或D处理后得到的二值图中的前景区块进行内部空洞消除,再进行标记。F每隔q帧对当前视频帧和经E处理后得到的二值图进行边缘检测,生成边缘二值图后执行逻辑与操作,再边缘划分,对得到的边缘标记;统计每个前景区块中的每条边缘被所包括的前景像素个数和其对应的边缘像素个数,判断边缘有效性。G根据F中得到的有效边缘,统计每个前景区块中的有效边缘,修改鬼影计数再进行鬼影检测。

    基于混合训练的深度学习人脸验证方法

    公开(公告)号:CN106203533A

    公开(公告)日:2016-12-07

    申请号:CN201610592954.5

    申请日:2016-07-26

    Applicant: 厦门大学

    Abstract: 基于混合训练的深度学习人脸验证方法。准备人脸数据集;对每幅图像进行人脸和人脸关键点检测;对所有人脸归一化,得人脸图像训练集,再划分为训练和验证数据集,计算所有人脸图像的均值图像;将所有人脸图像都减去均值图像得均值化的训练数据集和验证数据集;训练深度卷积神经网络;对每幅人脸图像生成对应的三元组,构成三元组训练数据集和三元组验证数据集;再次训练深度卷积神经网络;对于给定待验证的两幅图像进行人脸和人脸特征点检测,并减去均值图像,输入深度卷积神经网络中,进行网络前馈操作,并提取特征;根据选定的阈值,当两幅图像提取特征之间的距离大于阈值,判定两张图像中的人脸属于同一个人,否则判定为不同人。

    一种人脸姿态检测方法与在人脸识别中的应用

    公开(公告)号:CN103268497B

    公开(公告)日:2016-03-09

    申请号:CN201310241306.1

    申请日:2013-06-18

    Applicant: 厦门大学

    Abstract: 一种人脸姿态检测方法与在人脸识别中的应用,涉及一种人脸识别。对训练集中的图像分类,通过训练集的HOG特征计算出对应于三种人脸姿态的姿态估计滤波器组,通过训练集的Gabor特征计算出对应于三种人脸姿态的识别滤波器组,根据测试图片的HOG特征判定图像中人脸的姿态方向并利用相应的识别滤波器组做识别。将人脸姿态分为三类:左侧、正面、右侧姿态人脸。分别提取三类人脸姿态的HOG和Gabor特征。用PCA分别对三类人脸姿态的HOG和Gabor特征去噪和降维。提取每类人脸的轮廓信息。提取测试图像的HOG特征并以此信息判定该测试人脸的姿态方向。根据测试人脸的姿态方向利用相应的Gabor滤波器组识别测试图像。

    协变局部特征聚集的图像特征表示法

    公开(公告)号:CN105335500A

    公开(公告)日:2016-02-17

    申请号:CN201510710221.2

    申请日:2015-10-28

    Applicant: 厦门大学

    Inventor: 赵万磊 王菡子

    Abstract: 协变局部特征聚集的图像特征表示法,涉及计算机视觉与多媒体信息检索。提取图像局部特征;离线训练一个小的视觉词汇集合;将每幅图的局部特征用简化的费舍尔核方法进行聚集;聚集时,同时考虑每个局部特征的主方向信息,将主方向分为8个量化区间,根据量化后的主方向值,聚集到不同的费舍尔子向量,8个子向量拼接为一个长向量,作为图像的特征表示;将8个费舍尔子向量重组得一系列8维的子向量。对每个子向量进行一维离散余弦变换,变换到该特征的频率域;再对频率域的特征重组,得不同频段的8个子向量,对每个子向量做主成分分析,再对降维后的8个子向量重组得一系列8维的子向量;在子向量上定义相似度度量,以计算图像两两间的相似度。

    基于超图模式搜索的鲁棒模型拟合方法

    公开(公告)号:CN104835174A

    公开(公告)日:2015-08-12

    申请号:CN201510269932.0

    申请日:2015-05-25

    Applicant: 厦门大学

    CPC classification number: G06T7/162 G06T7/174 G06T2207/20072

    Abstract: 基于超图模式搜索的鲁棒模型拟合方法,涉及计算机视觉技术。准备数据集;建立超图模型G=(V,E),一个模型假设对应于超图中的一个顶点v,数据点则对应一条超边e:让每个顶点连接相应模型假设的内点,即超边;采用无参核密度估计方法评估每个顶点v的权重分数w(v),自此,模型拟合问题便转化为在超图中模式搜索问题;提出通过在超图中搜索权重波峰进行模式搜索;通过搜索到的模式和超图模型,确定每个结构的内点和参数;根据每个结构的参数和内点,对图像进行分割,完成模型拟合。能够缓解对数据分布的敏感性,建立的超图不需要任何的转化,可以直接被应用于模式搜索。

    基于拉格朗日对偶的半正定谱聚类方法

    公开(公告)号:CN102982342B

    公开(公告)日:2015-07-15

    申请号:CN201210445602.9

    申请日:2012-11-08

    Applicant: 厦门大学

    Abstract: 基于拉格朗日对偶的半正定谱聚类方法,涉及一种谱聚类方法。A.对给定样本数据集采用主成分分析进行降维;B.基于全向连接图的方法构造样本数据集的相似度矩阵,并采用基于高斯核函数和多项式核函数的加权和方法来计算样本数据对之间的相似度;C.基于拉格朗日对偶性质对相似度矩阵进行半正定归一化求解;D.对归一化矩阵进行奇异值分解,得到前k个最大特征值对应的特征向量组成的矩阵;E.利用传统的k均值聚类或者其他聚类方法对特征向量矩阵进行聚类分析得到最终的聚类结果。可对各类数据进行有效地聚类,通过对算法分析可知,相对于常规的半正定谱聚类求解算法,不仅可提高谱聚类的精度,而且可极大降低谱聚类所需的时间。

    一种基于贝叶斯概率框架的场景文本识别方法

    公开(公告)号:CN103984943A

    公开(公告)日:2014-08-13

    申请号:CN201410238427.5

    申请日:2014-05-30

    Applicant: 厦门大学

    Inventor: 王菡子 王大寒

    Abstract: 一种基于贝叶斯概率框架的场景文本识别方法,涉及计算机视觉和模式识别。步骤S1:输入场景图像文本;步骤S2:字符检测和识别;步骤S3:构建检测-识别候选网格,具体方法如下:将候选字符区域和对应的字符类别和识别分数保存在一个检测与识别候选网格里,这样候选网格里每一条检测-识别路径对应一个文本检测和识别结果;设计路径评价函数,对候选网格里的每一条候选检测-识别路径进行评价;步骤S4:根据路径评价函数,从候选网格中用动态规划算法搜索得到最优检测-识别路径,即得到识别结果;步骤S5:输出文本识别结果。解决了集成检测与识别的场景文本识别的概率建模和参数学习问题。

    基于拉格朗日对偶的半正定谱聚类方法

    公开(公告)号:CN102982342A

    公开(公告)日:2013-03-20

    申请号:CN201210445602.9

    申请日:2012-11-08

    Applicant: 厦门大学

    Abstract: 基于拉格朗日对偶的半正定谱聚类方法,涉及一种谱聚类方法。A.对给定样本数据集采用主成分分析进行降维;B.基于全向连接图的方法构造样本数据集的相似度矩阵,并采用基于高斯核函数和多项式核函数的加权和方法来计算样本数据对之间的相似度;C.基于拉格朗日对偶性质对相似度矩阵进行半正定归一化求解;D.对归一化矩阵进行奇异值分解,得到前k个最大特征值对应的特征向量组成的矩阵;E.利用传统的k均值聚类或者其他聚类方法对特征向量矩阵进行聚类分析得到最终的聚类结果。可对各类数据进行有效地聚类,通过对算法分析可知,相对于常规的半正定谱聚类求解算法,不仅可提高谱聚类的精度,而且可极大降低谱聚类所需的时间。

    一种基于双重净化动态图网络的鲁棒模型拟合方法

    公开(公告)号:CN119963847A

    公开(公告)日:2025-05-09

    申请号:CN202510150715.3

    申请日:2025-02-11

    Applicant: 厦门大学

    Abstract: 一种基于双重净化动态图网络的鲁棒模型拟合方法,涉及计算机视觉技术领域。针对含噪声与离群点的数据集,通过尺度不变特征变换生成初始对应集,并引入动态图网络进行处理。提出一种双重动态净化模块,包括区域通道偏好块和整体空间一致块,分别从局部与全局视角实现逐步采样和离群点剔除,获取净化后的候选对应集及内点概率集。区域通道偏好块通过偏好注意力机制强化局部特征,整体空间一致块通过一致注意力机制捕获长程依赖关系。利用净化后的候选对应集拟合模型参数,并结合内点概率集计算模型估计损失与点分类损失。充分利用动态图网络特性与偏好一致策略,在抗噪性和拟合精度方面显著优于现有技术。

Patent Agency Ranking