一种基于特征剪裁和平移的语音识别数据增强方法

    公开(公告)号:CN114171012A

    公开(公告)日:2022-03-11

    申请号:CN202111344696.6

    申请日:2021-11-15

    Abstract: 本发明涉及一种基于特征剪裁和平移的语音识别数据增强方法,属于语音识别处理技术领域。本方法分别在时间维度和频率维度上,对音频信号特征进行剪裁和平移。其中,在时间维度上,随机选取某一时间段的特征值,裁剪该时间段的特征,然后将未被裁剪的特征值沿时间维度方向平移;在频率维度方向,随机选取某一频率段的特征值,然后裁剪该频率段的特征,将未被裁剪的特征值沿着频率方向平移。本方法无需再重新生成音频信号,也无需再提取特征,避免了存储空间与运行时间的浪费,比现有的数据增强技术的数据增强效果更好,有效提升了语音识别效果。

    一种基于特征剪裁和平移的语音识别数据增强方法

    公开(公告)号:CN114171012B

    公开(公告)日:2025-03-14

    申请号:CN202111344696.6

    申请日:2021-11-15

    Abstract: 本发明涉及一种基于特征剪裁和平移的语音识别数据增强方法,属于语音识别处理技术领域。本方法分别在时间维度和频率维度上,对音频信号特征进行剪裁和平移。其中,在时间维度上,随机选取某一时间段的特征值,裁剪该时间段的特征,然后将未被裁剪的特征值沿时间维度方向平移;在频率维度方向,随机选取某一频率段的特征值,然后裁剪该频率段的特征,将未被裁剪的特征值沿着频率方向平移。本方法无需再重新生成音频信号,也无需再提取特征,避免了存储空间与运行时间的浪费,比现有的数据增强技术的数据增强效果更好,有效提升了语音识别效果。

Patent Agency Ranking