一种音频特征提取方法、装置及系统

    公开(公告)号:CN113611288A

    公开(公告)日:2021-11-05

    申请号:CN202110901109.2

    申请日:2021-08-06

    Inventor: 岑吴镕 李骊

    Abstract: 本申请公开了一种音频特征提取方法、装置及系统,获取音频信息,对音频信息执行加强语音信号性能的预处理,得到经过预处理后的音频信息,通过快速傅里叶变换将经过预处理后的音频信息由时间域转换为频率域,将频率域的音频信息经过基于音频信息的语种信息设置频率的梅尔滤波器组的滤波处理,确定音频信息的音频特征向量。本方案通过在对音频信息经过预处理、快速傅里叶变换后,通过梅尔滤波器组进行滤波处理,梅尔滤波器组是基于音频信息的语种信息设置的频率,从而使得音频信息经过的滤波处理是基于音频信息性本身的语种信息实现的,与其语种特征相关联,从而确定的音频特征向量更符合该音频信息对应的语种信息的特征,提高了音频识别的精度。

    设备的唤醒方法及装置、电子设备、计算机存储介质

    公开(公告)号:CN112433770A

    公开(公告)日:2021-03-02

    申请号:CN202011305374.6

    申请日:2020-11-19

    Inventor: 岑吴镕 李骊

    Abstract: 本申请提供了一种设备的唤醒方法及装置、电子设备、计算机存储介质,所述方法包括:实时采集语音唤醒指令及图像采集区域的图像;当采集到对目标设备的语音唤醒指令时,计算得到语音唤醒指令的声源位置信息;结合语音唤醒指令的声源位置信息以及图像采集区域的图像中识别出的人脸,确定发出语音唤醒指令的目标用户;若目标用户不是当前目标设备的唤醒人,判断目标用户的优先级是否高于当前目标设备的唤醒人的优先级;目标设备的唤醒人为被设置为具有唤醒目标设备权限的唯一用户,直至用户被取代或主动退出;若判断结果为是,则将目标用户设置为目标设备的唤醒人,响应目标用户的语音唤醒指令,若判断结果为否,则拒绝响应目标用户的语音唤醒指令。

    一种数据滤波方法和相关设备

    公开(公告)号:CN113643689A

    公开(公告)日:2021-11-12

    申请号:CN202110752741.5

    申请日:2021-07-02

    Inventor: 岑吴镕 李骊

    Abstract: 本发明提供一种数据滤波方法和相关设备,方案包括:在获取到输入数据时,且当所述输入数据位于第一区间时,基于“第一区间内各个输入数据所对应的滤波系数所构成的曲线的斜率为正数,且随着输入数据的增大而减小”的原则确定与所述输入数据对应的滤波系数,当所述输入数据位于第二区间时,基于“第二区间内各个输入数据所对应的滤波系数所构成的曲线的斜率为负数,且斜率的绝对值随着输入数据的增大而减小”的选择确定与所述输入数据对应的滤波系数,最后采用所述滤波系数对所述输入数据进行滤波。采用应用有本申请实施例公开的滤波方法的滤波器进行MFCC特征提取时,能够有效提高提取结果的可靠性。

    语音识别模型的匹配方法、装置、设备和存储介质

    公开(公告)号:CN113345428B

    公开(公告)日:2023-08-04

    申请号:CN202110627036.2

    申请日:2021-06-04

    Inventor: 岑吴镕 李骊

    Abstract: 本申请提供一种语音识别模型的匹配方法、装置、设备和存储介质,方法包括,若语音识别模型识别当前语音(指代在当前采集环境下采集的语音)时准确率低于准确率阈值,制作符合当前采集环境的样本语音;基于语音识别模型获得样本语音的语音识别结果,并根据样本语音的语音识别结果的准确率确定修正系数;利用修正系数修正当前语音的音频特征,得到修正后音频特征;利用语音识别模型解码修正后音频特征,得到当前语音的语音识别结果。当语音识别模型准确率降低时,本方案只需根据样本语音确定出修正系数,即可完成语音识别模型的匹配,不需要重新训练语音识别模型,显著提高了匹配语音识别模型的效率。

    音频特征处理方法及装置、存储介质及电子设备

    公开(公告)号:CN113160797B

    公开(公告)日:2023-06-02

    申请号:CN202110447185.0

    申请日:2021-04-25

    Inventor: 岑吴镕 李骊

    Abstract: 本发明提供了一种音频特征处理方法及装置、存储介质及电子设备,该方法包括:获取待处理音频的目标音频帧的音频特征,所述音频特征由多个维度的子特征数据组成;在所述音频特征的各个维度的子特征数据中确定出所述音频特征的目标子特征数据;对所述目标子特征数据进行增强,获得增强子特征数据;将所述音频特征中的目标子特征数据替换为所述增强子特征数据,获得目标音频特征。应用本发明提供的音频特征处理方法,能够对音频特征的部分特征维度的子特征数据进行增强,从而获取到新的目标音频特征数据,能够极大的减少扩充音频特征的所花费时间,节约计算资源,提升音频特征的扩充效率。

    语音端点检测的方法、装置、设备和存储介质

    公开(公告)号:CN113314153B

    公开(公告)日:2023-09-01

    申请号:CN202110690082.7

    申请日:2021-06-22

    Inventor: 岑吴镕 李骊

    Abstract: 本申请提供一种语音端点检测的方法、装置、设备和存储介质,方法包括,将待检测音频划分为多个音频帧;计算每一个音频帧的能量参数;在其中由小至大的选取预设比例的能量参数,计算选取的能量参数的平均值,得到基准阈值;检测每个帧组合(指每两个连续的音频帧)是否符合起始条件(帧组合中每个音频帧的能量参数均大于N倍的基准阈值)或终止条件(帧组合中每个音频帧的能量参数均小于M倍的基准阈值);标记符合起始条件的帧组合之前一个音频帧为语音起始帧,标记符合终止条件的帧组合之中第二个音频帧为语音终止帧。本方案能够针对不同音频动态确定语音端点检测所用的基准阈值,针对不同情况下采集到的音频进行检测时均有较高的准确度。

    一种数据滤波方法和相关设备

    公开(公告)号:CN113643689B

    公开(公告)日:2023-08-18

    申请号:CN202110752741.5

    申请日:2021-07-02

    Inventor: 岑吴镕 李骊

    Abstract: 本发明提供一种数据滤波方法和相关设备,方案包括:在获取到输入数据时,且当所述输入数据位于第一区间时,基于“第一区间内各个输入数据所对应的滤波系数所构成的曲线的斜率为正数,且随着输入数据的增大而减小”的原则确定与所述输入数据对应的滤波系数,当所述输入数据位于第二区间时,基于“第二区间内各个输入数据所对应的滤波系数所构成的曲线的斜率为负数,且斜率的绝对值随着输入数据的增大而减小”的选择确定与所述输入数据对应的滤波系数,最后采用所述滤波系数对所述输入数据进行滤波。采用应用有本申请实施例公开的滤波方法的滤波器进行MFCC特征提取时,能够有效提高提取结果的可靠性。

    语音识别模型的匹配方法、装置、设备和存储介质

    公开(公告)号:CN113345428A

    公开(公告)日:2021-09-03

    申请号:CN202110627036.2

    申请日:2021-06-04

    Inventor: 岑吴镕 李骊

    Abstract: 本申请提供一种语音识别模型的匹配方法、装置、设备和存储介质,方法包括,若语音识别模型识别当前语音(指代在当前采集环境下采集的语音)时准确率低于准确率阈值,制作符合当前采集环境的样本语音;基于语音识别模型获得样本语音的语音识别结果,并根据样本语音的语音识别结果的准确率确定修正系数;利用修正系数修正当前语音的音频特征,得到修正后音频特征;利用语音识别模型解码修正后音频特征,得到当前语音的语音识别结果。当语音识别模型准确率降低时,本方案只需根据样本语音确定出修正系数,即可完成语音识别模型的匹配,不需要重新训练语音识别模型,显著提高了匹配语音识别模型的效率。

    语音端点检测的方法、装置、设备和存储介质

    公开(公告)号:CN113314153A

    公开(公告)日:2021-08-27

    申请号:CN202110690082.7

    申请日:2021-06-22

    Inventor: 岑吴镕 李骊

    Abstract: 本申请提供一种语音端点检测的方法、装置、设备和存储介质,方法包括,将待检测音频划分为多个音频帧;计算每一个音频帧的能量参数;在其中由小至大的选取预设比例的能量参数,计算选取的能量参数的平均值,得到基准阈值;检测每个帧组合(指每两个连续的音频帧)是否符合起始条件(帧组合中每个音频帧的能量参数均大于N倍的基准阈值)或终止条件(帧组合中每个音频帧的能量参数均小于M倍的基准阈值);标记符合起始条件的帧组合之前一个音频帧为语音起始帧,标记符合终止条件的帧组合之中第二个音频帧为语音终止帧。本方案能够针对不同音频动态确定语音端点检测所用的基准阈值,针对不同情况下采集到的音频进行检测时均有较高的准确度。

    音频特征处理方法及装置、存储介质及电子设备

    公开(公告)号:CN113160797A

    公开(公告)日:2021-07-23

    申请号:CN202110447185.0

    申请日:2021-04-25

    Inventor: 岑吴镕 李骊

    Abstract: 本发明提供了一种音频特征处理方法及装置、存储介质及电子设备,该方法包括:获取待处理音频的目标音频帧的音频特征,所述音频特征由多个维度的子特征数据组成;在所述音频特征的各个维度的子特征数据中确定出所述音频特征的目标子特征数据;对所述目标子特征数据进行增强,获得增强子特征数据;将所述音频特征中的目标子特征数据替换为所述增强子特征数据,获得目标音频特征。应用本发明提供的音频特征处理方法,能够对音频特征的部分特征维度的子特征数据进行增强,从而获取到新的目标音频特征数据,能够极大的减少扩充音频特征的所花费时间,节约计算资源,提升音频特征的扩充效率。

Patent Agency Ranking