-
公开(公告)号:CN113313736A
公开(公告)日:2021-08-27
申请号:CN202110649381.6
申请日:2021-06-10
Applicant: 厦门大学
IPC: G06T7/246 , G06T7/62 , G06T7/66 , G06T7/73 , G06K9/00 , G06K9/46 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 统一目标运动感知和重识别网络的在线多目标跟踪方法,涉及计算机视觉技术。A.将当前帧图像与前一帧图像输入到骨干网络,获得两帧图像的特征图;B.将前一帧图像的热力图与步骤A两个特征图送入检测与跟踪分支,得计算当前帧检测结果及目标跟踪偏移量;C.将步骤A两帧图像的特征图送入重识别分支,得嵌入特征向量,存储于重识别特征向量池中;D.根据跟踪偏移量,对步骤B获得的检测结果进行第一次匹配,为已匹配的检测分配对应目标的身份识别;E.对步骤D获得的未匹配检测结果进行第二次匹配,将未匹配检测结果与步骤C获得的嵌入特征向量逐一进行相似性计算,根据设定的阈值,为不同检测结果分配身份识别,即得当前帧最终的跟踪结果。
-
公开(公告)号:CN113239833A
公开(公告)日:2021-08-10
申请号:CN202110551957.5
申请日:2021-05-20
Applicant: 厦门大学
Abstract: 一种基于双分支干扰分离网络的人脸表情识别方法,涉及计算机视觉技术。提供可以处理表情图像中多种干扰因素的一种基于双分支干扰分离网络的人脸表情识别方法。首先设计一个双分支网络来分开学习表情特征和干扰特征,再根据干扰特征的不同类型在干扰分支中设计标签感知子分支和无标签子分支。在标签感知子分支中,利用辅助数据集的标签信息和迁移学习的方式学习常见干扰特征。在无标签子分支中,引入印度自助餐过程理论学习潜在干扰特征。最后,通过对抗学习,进一步分离干扰特征和表情特征,从而获得更有判别力的表情特征进行分类预测,有效地提升表情识别的性能。
-
公开(公告)号:CN110443189B
公开(公告)日:2021-08-03
申请号:CN201910704048.3
申请日:2019-07-31
Applicant: 厦门大学
Abstract: 基于多任务多标签学习卷积神经网络的人脸属性识别方法,涉及计算机视觉技术。首先采用多任务学习,同时学习人脸关键点检测和人脸属性识别两个任务;考虑不同属性的学习难度和学习收敛速度不同,将属性分为主观属性和客观属性,采用动态权重和自适应阈值策略来加快网络的收敛速度和缓解样本不平衡问题;最终根据训练好的网络模型,将主观属性和客观属性子网络的人脸属性识别结果作为最终的人脸属性识别结果。使用动态权重方案和自适应阈值调整,加快网路收敛速度的同时可缓解标签不平衡问题;采用空间金字塔池化的方法训练三个不同的子网络,达到了端到端的训练进行多任务多人脸属性识别。提高人脸属性识别的精度,尤其是难度较大的主观属性。
-
公开(公告)号:CN110135366B
公开(公告)日:2021-04-13
申请号:CN201910418070.1
申请日:2019-05-20
Applicant: 厦门大学
Abstract: 基于多尺度生成对抗网络的遮挡行人重识别方法,涉及计算机视觉技术。准备行人图像训练集;设计和训练一个多尺度生成对抗网络,该网络包括多尺度生成器和判别器两部分,其中,多尺度生成器能够对随机遮挡区域进行去遮挡操作,生成高质量的重构图;而判别器能够区分输入图像是真实图像还是生成图像;利用训练好的多尺度生成器产生扩充的行人图像训练集;设计和训练一个分类识别网络,该网络用于对输入的行人图像进行身份分类;利用训练好的分类识别网络提取行人图像的特征并进行相似度匹配。
-
公开(公告)号:CN110148159B
公开(公告)日:2021-03-26
申请号:CN201910418073.5
申请日:2019-05-20
Applicant: 厦门大学
IPC: G06T7/246
Abstract: 一种基于事件相机的异步目标跟踪方法,涉及计算机视觉技术。包含三个主要部分:开始的目标检测模块、目标跟踪模块和恢复跟踪模块;所述开始的目标检测模块用于提取ATSLTD帧上的目标建议窗口;所述目标跟踪模块根据最小化目标时空不一致信息原则选择最佳的目标建议窗口作为跟踪结果;所述恢复跟踪模块用于跟踪失败时恢复对目标的跟踪。该方法能够有效地应对目标跟踪中存在的目标快速运动和高动态范围场景等问题,取得了优于主流基于传统相机的目标跟踪算法的精度。
-
公开(公告)号:CN110188817B
公开(公告)日:2021-02-26
申请号:CN201910452356.1
申请日:2019-05-28
Applicant: 厦门大学
Abstract: 一种基于深度学习的实时高性能街景图像语义分割方法。准备街景图像训练、验证和测试数据集;对数据集图像进行下采样,减小图像的分辨率;对现有的轻量级分类网络进行改造作为语义分割的基础特征提取网络;在基础特征提取网络后串联一个鉴别性孔洞空间金字塔池化用于解决语义分割的多尺度问题;将若干个卷积层堆叠,形成浅层的空间信息保存网络;使用特征融合网络将得到的特征图进行融合形成预测结果;将输出图像与数据集中的语义标注图像进行对比,利用反向传播算法进行端到端的训练,得到实时高性能街景图像语义分割网络模型;将待测试的街景图像输入实时高性能街景图像语义分割网络模型中得到街景图像的语义分割结果。
-
公开(公告)号:CN112287999A
公开(公告)日:2021-01-29
申请号:CN202011166826.7
申请日:2020-10-27
Applicant: 厦门大学
Abstract: 利用卷积神经网络矫正梯度的弱监督目标定位方法,涉及计算机视觉技术领域。在给定的只包含类别标签的数据集上训练好一个用于分类功能的卷积神经网络,先对网络进行正向传递,然后指定待定位的目标的类别,进行卷积神经网络矫正梯度的反向传递,即从输出层向输入层逐层反向传递梯度,并且进行相应的矫正操作。卷积神经网络矫正梯度的反向传递包含对网络中全连接层、卷积层等传递的梯度进行了矫正。生成的热图中目标轮廓清晰,获取的定位精度高,同时能够区分不同类别的目标,定位的区域含有较少无关背景。对含有负值特征的模型具有鲁棒性。
-
公开(公告)号:CN112084954A
公开(公告)日:2020-12-15
申请号:CN202010948845.9
申请日:2020-09-10
Applicant: 腾讯科技(深圳)有限公司 , 厦门大学
Abstract: 本发明提供了一种视频目标的检测方法、装置、电子设备以及存储介质,方法包括:确定待检测视频中的待检测视频帧,并获取与所述待检测视频帧相匹配的视频序列中的辅助视频帧;基于所述待检测视频帧与所述辅助视频帧,通过视频处理模型中的特征提取网络确定帧级别的特征向量;基于所述帧级别的特征向量,通过所述视频处理模型的候选框生成网络,确定实例级别的特征向量;通过所述视频处理模型中的检测头网络,根据所述实例级别的特征向量,对所述待检测视频进行目标检测,确定视频目标在所述待检测视频的不同视频帧中的所在区域,由此,由此实现鲁棒并精确地对视频中的目标进行检测,减少视频目标检测中的失真。
-
公开(公告)号:CN108564029B
公开(公告)日:2020-12-01
申请号:CN201810323645.7
申请日:2018-04-12
Applicant: 厦门大学
Abstract: 基于级联多任务学习深度神经网络的人脸属性识别方法,涉及计算机视觉技术。首先设计级联的深度卷积神经网络,然后在级联的深度卷积神经网络里,对于每一个级联的子网络,采用多任务学习,同时学习人脸分类、边框回归、人脸关键点检测、人脸属性分析四个任务,接着在基于级联多任务学习的深度卷积神经网络里,采用一种动态损失权重机制,来计算人脸属性的损失权重,最终根据训练好的网络模型,将级联的最后一个子网络的人脸属性识别结果作为最终的人脸属性识别结果。使用级联的方法联合训练了三个不同的子网络,达到了端到端的训练,优化了人脸属性识别的结果,不同于在损失函数里使用固定的损失权重,本发明考虑到不同人脸属性间的差异性。
-
公开(公告)号:CN111914107A
公开(公告)日:2020-11-10
申请号:CN202010746717.6
申请日:2020-07-29
Applicant: 厦门大学
Abstract: 一种基于多通道注意力区域扩展的实例检索方法,涉及图像检索技术领域。首先提出多通道注意力区域扩展模块,在网络训练中仅依赖图像类别标签,从多个通道进行注意力区域扩展操作,分别实现对图像中的多个实例进行相对完整的定位。根据定位进行特征提取的过程中,引入多分支联合训练,在提取特征时保留原信息,并进一步获得深层语义信息,增强特征的判别力。不同于已有的技术,只依赖图像类别标签训练卷积神经网络,基于类激活图和注意力区域扩展模块对图像中实例进行定位的同时,提取具有判别性的实例特征用于实例检索。可应用到电商网站的在线购物、视频媒体的智能化检索等现实场景。
-
-
-
-
-
-
-
-
-