基于卷积神经网络的快速目标检测方法

    公开(公告)号:CN104573731A

    公开(公告)日:2015-04-29

    申请号:CN201510061852.6

    申请日:2015-02-06

    Applicant: 厦门大学

    Abstract: 基于卷积神经网络的快速目标检测方法,涉及计算机视觉技术。首先利用训练集训练出卷积神经网络参数,然后利用扩展图的方式解决最大池化丢失特征的问题并生成判别完备特征图;把卷积神经网络的全连接权重看成线性分类器,采用可能近似学习框架来估计线性分类器在判别完备特征上的泛华误差;根据泛华误差和所期望泛化误差阈值来估算所需线性分类器个数,最后在判别完备特征图上用线性分类器基于平滑窗的方式完成目标检测。显著提高检测效率和目标检测精度。

    一种基于双重净化动态图网络的鲁棒模型拟合方法

    公开(公告)号:CN119963847A

    公开(公告)日:2025-05-09

    申请号:CN202510150715.3

    申请日:2025-02-11

    Applicant: 厦门大学

    Abstract: 一种基于双重净化动态图网络的鲁棒模型拟合方法,涉及计算机视觉技术领域。针对含噪声与离群点的数据集,通过尺度不变特征变换生成初始对应集,并引入动态图网络进行处理。提出一种双重动态净化模块,包括区域通道偏好块和整体空间一致块,分别从局部与全局视角实现逐步采样和离群点剔除,获取净化后的候选对应集及内点概率集。区域通道偏好块通过偏好注意力机制强化局部特征,整体空间一致块通过一致注意力机制捕获长程依赖关系。利用净化后的候选对应集拟合模型参数,并结合内点概率集计算模型估计损失与点分类损失。充分利用动态图网络特性与偏好一致策略,在抗噪性和拟合精度方面显著优于现有技术。

    一种基于时空场景连通图的开放词汇多目标跟踪方法

    公开(公告)号:CN119963605A

    公开(公告)日:2025-05-09

    申请号:CN202510150262.4

    申请日:2025-02-11

    Applicant: 厦门大学

    Abstract: 一种基于时空场景连通图的开放词汇多目标跟踪方法,涉及计算机视觉技术。A.给定训练数据集,包含视频序列和对象的相关状态信息。B.将视频帧序列输入预训练的检测器,提取视频帧的特征,并生成每帧中的对象候选框。C.根据生成的候选框,从全局特征图中利用ROI池化操作提取每个候选框对应的局部特征。D.将提取的ROI区域特征输入解码器,通过多头自注意力提取目标间的各种关系。E.将获得的关键帧与参考帧的关系输入连接头,得到关联预测结果,产生图关联损失。F.将关键帧与参考帧中经过解码器处理的ROI特征计算外观相似度,得到关联预测,得到外观关联损失与步骤E产生的图关联损失共同组成网络的损失函数。提升跟踪性能。

    点监督X射线违禁品检测的域内-域间对象性学习方法

    公开(公告)号:CN119090818A

    公开(公告)日:2024-12-06

    申请号:CN202411089623.0

    申请日:2024-08-09

    Applicant: 厦门大学

    Abstract: 本发明公开了点监督X射线违禁品检测的域内‑域间对象性学习方法,本方案通过域内‑域间对象性模块在点监督下进行X射线违禁物品检测,该方案由域内对象性学习模块和域间对象性性学习模块两个关键模块组成;域内对象性学习模块设计了局部焦点高斯掩蔽块和全局随机高斯掩蔽块,共同学习X射线图片中的对象性。域间对象性学习模块引入了基于小波分解的对抗学习块和对象性块,有效减少了模态差异,并将从带有实例级标注的自然图片中学到的对象性知识迁移到了X射线图片中。本方案缓解了X射线图片中由严重类内变化引起的局部主导的问题。在四个X射线数据集上的实验结果显示,本发明在显著降低注释成本的同时实现了卓越性能,提高了其实用性。

    基于自步协同学习框架的小样本人脸表情识别方法及介质

    公开(公告)号:CN118968580A

    公开(公告)日:2024-11-15

    申请号:CN202410920453.X

    申请日:2024-07-10

    Abstract: 本发明公开了基于自步协同学习框架的小样本人脸表情识别方法及介质,包括:获取基本类表情数据集和复合类表情数据集;建立自步协同学习网络,包括混合专家卷积层和分类模型;对不同混合专家卷积层的通道数进行缩放;混合专家卷积层在欧式空间中进行表情特征嵌入学习;基于专家模型构建教师模型和学生模型,得到对应的表情特征;将教师模型和学生模型获取的表情特征从欧式空间映射到双曲空间,对自步协同学习网络进行表情特征嵌入学习;使用分类模型对表情特征进行分类,完成最终的训练;将复合类表情数据集输入训练好的自步协同学习网络进行表情分类计算,输出分类结果,识别不同表情。本发明有效提高了表情识别准确度。

    基于联合和交替学习框架的跨域新类人脸表情识别方法

    公开(公告)号:CN114333027B

    公开(公告)日:2024-05-14

    申请号:CN202111671593.0

    申请日:2021-12-31

    Abstract: 本发明公开了基于联合和交替学习框架的跨域新类人脸表情识别方法,包括:A、建立基本类表情数据集和复合类表情数据集;B、构建用于表情数据识别的情感‑相似度网络;C、对步骤B中的情感分支进行训练全部基本类表情数据的分类模型;D、对步骤B中的相似度分支进行学习表情数据可迁移的特征和度量;E、构建二阶段的联合和交替学习学习框架进行训练情感‑相似度网络,以提高模型对新类表情的泛化能力;F、在复合类表情数据集上采样N个类,使每类包含K个有标签样本作为支持集,每类Q个样本作为查询集,然后基于经训练的相似度分支对查询集进行新类表情分类准确率的计算;本方案是一种灵活且贴近实际需求的解决新类人脸表情识别问题的方案。

    基于异质模型拟合的运动分割方法

    公开(公告)号:CN112308877B

    公开(公告)日:2022-05-17

    申请号:CN202011165026.3

    申请日:2020-10-27

    Applicant: 厦门大学

    Abstract: 基于异质模型拟合的运动分割方法,涉及计算机视觉技术。首先,使用基于密度估计技术的投票方法,通过对异质模型假设质量的评价,生成高质量的累积相关矩阵。在此基础上,利用信息论构造稀疏亲和矩阵的方法,有效地抑制了不同目标之间的关联值。最后,利用归一化谱聚类算法对融合后的稀疏亲和矩阵进行分割,得到准确的分割结果。解决现有技术存在的真实场景中外界的光照变化、运动物体的表观和遮挡,可能会导致跟踪点包含异常值和噪声等问题。

    一种基于双分支干扰分离网络的人脸表情识别方法

    公开(公告)号:CN113239833A

    公开(公告)日:2021-08-10

    申请号:CN202110551957.5

    申请日:2021-05-20

    Applicant: 厦门大学

    Abstract: 一种基于双分支干扰分离网络的人脸表情识别方法,涉及计算机视觉技术。提供可以处理表情图像中多种干扰因素的一种基于双分支干扰分离网络的人脸表情识别方法。首先设计一个双分支网络来分开学习表情特征和干扰特征,再根据干扰特征的不同类型在干扰分支中设计标签感知子分支和无标签子分支。在标签感知子分支中,利用辅助数据集的标签信息和迁移学习的方式学习常见干扰特征。在无标签子分支中,引入印度自助餐过程理论学习潜在干扰特征。最后,通过对抗学习,进一步分离干扰特征和表情特征,从而获得更有判别力的表情特征进行分类预测,有效地提升表情识别的性能。

    基于多任务多标签学习卷积神经网络的人脸属性识别方法

    公开(公告)号:CN110443189B

    公开(公告)日:2021-08-03

    申请号:CN201910704048.3

    申请日:2019-07-31

    Applicant: 厦门大学

    Abstract: 基于多任务多标签学习卷积神经网络的人脸属性识别方法,涉及计算机视觉技术。首先采用多任务学习,同时学习人脸关键点检测和人脸属性识别两个任务;考虑不同属性的学习难度和学习收敛速度不同,将属性分为主观属性和客观属性,采用动态权重和自适应阈值策略来加快网络的收敛速度和缓解样本不平衡问题;最终根据训练好的网络模型,将主观属性和客观属性子网络的人脸属性识别结果作为最终的人脸属性识别结果。使用动态权重方案和自适应阈值调整,加快网路收敛速度的同时可缓解标签不平衡问题;采用空间金字塔池化的方法训练三个不同的子网络,达到了端到端的训练进行多任务多人脸属性识别。提高人脸属性识别的精度,尤其是难度较大的主观属性。

    基于多尺度生成对抗网络的遮挡行人重识别方法

    公开(公告)号:CN110135366B

    公开(公告)日:2021-04-13

    申请号:CN201910418070.1

    申请日:2019-05-20

    Applicant: 厦门大学

    Abstract: 基于多尺度生成对抗网络的遮挡行人重识别方法,涉及计算机视觉技术。准备行人图像训练集;设计和训练一个多尺度生成对抗网络,该网络包括多尺度生成器和判别器两部分,其中,多尺度生成器能够对随机遮挡区域进行去遮挡操作,生成高质量的重构图;而判别器能够区分输入图像是真实图像还是生成图像;利用训练好的多尺度生成器产生扩充的行人图像训练集;设计和训练一个分类识别网络,该网络用于对输入的行人图像进行身份分类;利用训练好的分类识别网络提取行人图像的特征并进行相似度匹配。

Patent Agency Ranking