-
公开(公告)号:CN108416732A
公开(公告)日:2018-08-17
申请号:CN201810105951.3
申请日:2018-02-02
Applicant: 重庆邮电大学
Abstract: 本发明请求保护一种是基于图像配准与多分辨率融合的全景图像拼接方法。将序列图像自适应阈值二值化处理并利用像素邻域关系提取图像轮廓信息,通过Hu不变矩特征的相似性度量方法快速估算图像轮廓结构的相似区域,然后在两幅原图像相似区域部分进行SIFT特征点提取。并用双向K最邻近分类算法进行特征点初始匹配,RANSAC算法筛选误匹配点,估计图像间的仿射变换矩阵。另外在图像融合方面,采用亮度均衡化与局部色彩映射处理。然后通过改进的拉普拉斯金字塔多分率融合算法对拼接图像进行融合,实现无缝拼接。本发明不仅缩短了图像拼接时间,提高图像拼接的效率,而且可以快速定位相似区域,有效改善拼接中的误匹配,提高图像配准精度。
-
公开(公告)号:CN115393933A
公开(公告)日:2022-11-25
申请号:CN202211012667.4
申请日:2022-08-23
Applicant: 重庆邮电大学
IPC: G06V40/16 , G06V40/12 , G06V20/40 , G06V10/82 , G06V10/764 , G06N3/04 , G06N3/08 , G10L25/18 , G10L25/63
Abstract: 本发明属于人工智能、多模态人脸情绪识别技术领域,具体涉及一种基于帧注意力机制的视频人脸情绪识别方法,包括:将含有人脸的视频转换人脸与声音两种模态的特征表示,将人脸模态特征和声音模态特征进行特征联合表示,得到联合多模态特征,通过全连接计算,得到情绪分类的预测结果值,通过函数归一化情绪分类的预测结果值,并将预测概率分布值最大的视频人脸情绪作为最终的视频人脸情绪识别结果。本发明通过改进的帧注意力网络模型能有效的提取人脸模态特征和声音模态特征的时序信息和空间信息,从而能提升情绪识别的精度。
-
公开(公告)号:CN113435319B
公开(公告)日:2022-05-10
申请号:CN202110713283.4
申请日:2021-06-25
Applicant: 重庆邮电大学
IPC: G06V10/764 , G06V10/774 , G06V10/80 , G06V10/74 , G06V40/10 , G06K9/62
Abstract: 本发明属于多目标跟踪与行人角度识别领域,具体涉及一种联合多目标跟踪和行人角度识别的分类方法,该方法包括:将待检测的图像进行增强处理;将增强后的图像输入到训练好的分类模型中进行行人跟踪和角度的识别分类,根据分类结果对待检测图像进行标记;分类模型为改进的JDE多目标跟踪模型和行人角度识别模型;本发明通过特征共享的方式实现了多目标跟踪算法与行人角度识别的算法的结合,减小了模型参数数量,减小了计算量。本发明既能够对视频中出现的所有大目标以及中等目标进行跟踪,又能够对视频中出现的所有大目标以及中等目标的角度进行角度识别,同时该算法能够满足实时性要求。
-
公开(公告)号:CN113435319A
公开(公告)日:2021-09-24
申请号:CN202110713283.4
申请日:2021-06-25
Applicant: 重庆邮电大学
Abstract: 本发明属于多目标跟踪与行人角度识别领域,具体涉及一种联合多目标跟踪和行人角度识别的分类方法,该方法包括:将待检测的图像进行增强处理;将增强后的图像输入到训练好的分类模型中进行行人跟踪和角度的识别分类,根据分类结果对待检测图像进行标记;分类模型为改进的JDE多目标跟踪模型和行人角度识别模型;本发明通过特征共享的方式实现了多目标跟踪算法与行人角度识别的算法的结合,减小了模型参数数量,减小了计算量。本发明既能够对视频中出现的所有大目标以及中等目标进行跟踪,又能够对视频中出现的所有大目标以及中等目标的角度进行角度识别,同时该算法能够满足实时性要求。
-
-
-