Patent search ap:("北京理工大学") AND inv:"程浩东" Page 1

1.

发明公开
一种基于特征剪裁和平移的语音识别数据增强方法有权

公开(公告)号：CN114171012A

公开(公告)日：2022-03-11

申请号：CN202111344696.6

申请日：2021-11-15

Applicant: 北京理工大学

Inventor： 郭宇航 , 程浩东 , 陈朔鹰 , 吴丽婷

IPC: G10L15/06 , G10L25/03

Abstract: 本发明涉及一种基于特征剪裁和平移的语音识别数据增强方法，属于语音识别处理技术领域。本方法分别在时间维度和频率维度上，对音频信号特征进行剪裁和平移。其中，在时间维度上，随机选取某一时间段的特征值，裁剪该时间段的特征，然后将未被裁剪的特征值沿时间维度方向平移；在频率维度方向，随机选取某一频率段的特征值，然后裁剪该频率段的特征，将未被裁剪的特征值沿着频率方向平移。本方法无需再重新生成音频信号，也无需再提取特征，避免了存储空间与运行时间的浪费，比现有的数据增强技术的数据增强效果更好，有效提升了语音识别效果。

2.

发明授权
一种基于特征剪裁和平移的语音识别数据增强方法有权

公开(公告)号：CN114171012B

公开(公告)日：2025-03-14

申请号：CN202111344696.6

申请日：2021-11-15

Applicant: 北京理工大学

Inventor： 郭宇航 , 程浩东 , 陈朔鹰 , 吴丽婷

IPC: G10L15/06 , G10L25/03

Abstract: 本发明涉及一种基于特征剪裁和平移的语音识别数据增强方法，属于语音识别处理技术领域。本方法分别在时间维度和频率维度上，对音频信号特征进行剪裁和平移。其中，在时间维度上，随机选取某一时间段的特征值，裁剪该时间段的特征，然后将未被裁剪的特征值沿时间维度方向平移；在频率维度方向，随机选取某一频率段的特征值，然后裁剪该频率段的特征，将未被裁剪的特征值沿着频率方向平移。本方法无需再重新生成音频信号，也无需再提取特征，避免了存储空间与运行时间的浪费，比现有的数据增强技术的数据增强效果更好，有效提升了语音识别效果。

Patent Agency Ranking