Patent search ap:("重庆邮电大学") AND inv:"柯礼灵" Page 1

1.

发明公开
一种多摄像头的行为轨迹跟踪方法审中-实审

公开(公告)号：CN116188538A

公开(公告)日：2023-05-30

申请号：CN202211467537.X

申请日：2022-11-22

Applicant: 重庆邮电大学

Inventor： 刘歆 , 王心怡 , 钱鹰 , 万邦睿 , 陈奉 , 梁晋周 , 陈雪 , 柯礼灵

IPC: G06T7/292 , G06V10/62

Abstract: 本发明涉及一种多摄像头的行为轨迹跟踪方法，属于计算机视觉技术领域，包括以下步骤：S1：指定公共服务大厅多个摄像头，分别采集多个摄像头下服务区的坐标信息，将坐标信息与摄像头进行绑定；S2：结合目标检测模型和行人重识别模型对顾客轨迹进行跟踪，建立多个摄像头的顾客活动轨迹库；S3：计算多个摄像头下服务区与顾客目标检测框的IoU和深度图确认顾客是否到达服务区；S4：对顾客进入服务区到顾客离开服务区的行为进行识别；S5：构建多个摄像头下的顾客行为轨迹库，通过时间信息对齐，对行为进行筛选，得到顾客的行为轨迹。本专利通过在多个摄像头下跟踪顾客得到较为有效的顾客行为轨迹，可用于辅助公共服务大厅业务流程制定和划分。

2.

发明授权
基于深度残差网络和注意力机制的声纹识别方法及装置有权

公开(公告)号：CN114678030B

公开(公告)日：2024-09-06

申请号：CN202210304443.4

申请日：2022-03-17

Applicant: 重庆邮电大学 , 重庆市住房公积金管理中心

Inventor： 钱鹰 , 陈仕杰 , 杨世利 , 陈雪 , 刘歆 , 柯礼灵 , 熊炜

IPC: G10L17/02 , G10L17/04 , G10L17/14 , G10L17/18 , G10L25/24 , G06N3/0464 , G06N3/084

Abstract: 本发明涉及一种基于深度残差网络和注意力机制的声纹识别方法、装置及计算机可读存储介质，属于语音识别技术领域，包括步骤：S1：对采集到的音频数据进行预处理，得到能够模拟人耳某些特性的MFCC特征；S2：构建FAM，将S1得到的特征经过帧级注意力模块对每帧的重要性进行加权运算，得到加权后的MFCC特征；S3：构建声纹识别网络并进行声纹识别；引入MobileNet的设计思想，将普通卷积替换为深度可分离卷积以降低网络参数量；在ResNet50的每一个layer后加入通道域注意力模块建模各个特征通道的重要程度，针对不同的说话人增强或抑制不同的通道，最后将特征输入网络中的分类器进行分类，实现声纹识别。

3.

发明公开
基于深度残差网络和注意力机制的声纹识别方法及装置有权

公开(公告)号：CN114678030A

公开(公告)日：2022-06-28

申请号：CN202210304443.4

申请日：2022-03-17

Applicant: 重庆邮电大学 , 重庆市住房公积金管理中心

Inventor： 钱鹰 , 陈仕杰 , 杨世利 , 陈雪 , 刘歆 , 柯礼灵 , 熊炜

IPC: G10L17/02 , G10L17/04 , G10L17/14 , G10L17/18 , G10L25/24 , G06N3/04 , G06N3/08

Abstract: 本发明涉及一种基于深度残差网络和注意力机制的声纹识别方法、装置及计算机可读存储介质，属于语音识别技术领域，包括步骤：S1：对采集到的音频数据进行预处理，得到能够模拟人耳某些特性的MFCC特征；S2：构建FAM，将S1得到的特征经过帧级注意力模块对每帧的重要性进行加权运算，得到加权后的MFCC特征；S3：构建声纹识别网络并进行声纹识别；引入MobileNet的设计思想，将普通卷积替换为深度可分离卷积以降低网络参数量；在ResNet50的每一个layer后加入通道域注意力模块建模各个特征通道的重要程度，针对不同的说话人增强或抑制不同的通道，最后将特征输入网络中的分类器进行分类，实现声纹识别。

Patent Agency Ranking