-
公开(公告)号:CN116188538A
公开(公告)日:2023-05-30
申请号:CN202211467537.X
申请日:2022-11-22
Applicant: 重庆邮电大学
Abstract: 本发明涉及一种多摄像头的行为轨迹跟踪方法,属于计算机视觉技术领域,包括以下步骤:S1:指定公共服务大厅多个摄像头,分别采集多个摄像头下服务区的坐标信息,将坐标信息与摄像头进行绑定;S2:结合目标检测模型和行人重识别模型对顾客轨迹进行跟踪,建立多个摄像头的顾客活动轨迹库;S3:计算多个摄像头下服务区与顾客目标检测框的IoU和深度图确认顾客是否到达服务区;S4:对顾客进入服务区到顾客离开服务区的行为进行识别;S5:构建多个摄像头下的顾客行为轨迹库,通过时间信息对齐,对行为进行筛选,得到顾客的行为轨迹。本专利通过在多个摄像头下跟踪顾客得到较为有效的顾客行为轨迹,可用于辅助公共服务大厅业务流程制定和划分。
-
公开(公告)号:CN114678030B
公开(公告)日:2024-09-06
申请号:CN202210304443.4
申请日:2022-03-17
Applicant: 重庆邮电大学 , 重庆市住房公积金管理中心
Abstract: 本发明涉及一种基于深度残差网络和注意力机制的声纹识别方法、装置及计算机可读存储介质,属于语音识别技术领域,包括步骤:S1:对采集到的音频数据进行预处理,得到能够模拟人耳某些特性的MFCC特征;S2:构建FAM,将S1得到的特征经过帧级注意力模块对每帧的重要性进行加权运算,得到加权后的MFCC特征;S3:构建声纹识别网络并进行声纹识别;引入MobileNet的设计思想,将普通卷积替换为深度可分离卷积以降低网络参数量;在ResNet50的每一个layer后加入通道域注意力模块建模各个特征通道的重要程度,针对不同的说话人增强或抑制不同的通道,最后将特征输入网络中的分类器进行分类,实现声纹识别。
-
公开(公告)号:CN114678030A
公开(公告)日:2022-06-28
申请号:CN202210304443.4
申请日:2022-03-17
Applicant: 重庆邮电大学 , 重庆市住房公积金管理中心
Abstract: 本发明涉及一种基于深度残差网络和注意力机制的声纹识别方法、装置及计算机可读存储介质,属于语音识别技术领域,包括步骤:S1:对采集到的音频数据进行预处理,得到能够模拟人耳某些特性的MFCC特征;S2:构建FAM,将S1得到的特征经过帧级注意力模块对每帧的重要性进行加权运算,得到加权后的MFCC特征;S3:构建声纹识别网络并进行声纹识别;引入MobileNet的设计思想,将普通卷积替换为深度可分离卷积以降低网络参数量;在ResNet50的每一个layer后加入通道域注意力模块建模各个特征通道的重要程度,针对不同的说话人增强或抑制不同的通道,最后将特征输入网络中的分类器进行分类,实现声纹识别。
-
-