-
公开(公告)号:CN111599378A
公开(公告)日:2020-08-28
申请号:CN202010366001.3
申请日:2020-04-30
Applicant: 讯飞智元信息科技有限公司
Abstract: 本申请公开了一种音频匹配方法,电子设备及存储介质。该方法包括:获取待处理音频;按照划分方式将待处理音频划分为多个第一音频帧,其中相邻两个第一音频帧部分重叠;对每个第一音频帧进行傅里叶变换得到每个第一音频帧的频谱;基于第一音频帧的频谱,得到待处理音频的多个频谱峰值特征指纹;将待处理音频的多个频谱峰值特征指纹与数据库音频的多个频谱峰值特征指纹进行动态滑窗匹配检索,得到待处理音频的匹配结果。通过上述方式,本申请能够得到更加准确的待处理音频匹配结果。
-
公开(公告)号:CN111508505A
公开(公告)日:2020-08-07
申请号:CN202010349219.8
申请日:2020-04-28
Applicant: 讯飞智元信息科技有限公司
Abstract: 本申请提供了一种说话人识别方法、装置、设备及存储介质,其中,方法包括:以趋于由混合高斯模型针对待识别语音确定的说话人特征为获取方向,从待识别语音中获取目标说话人特征,其中,混合高斯模型采用多个说话人的多条语音数据训练得到,混合高斯模型能够对语音数据中说话人个性特征的分布进行描述;根据目标说话人特征,识别待识别语音对应的说话人。本申请提供的说话人识别方法能够准确地识别出待识别语音对应的说话人。
-
公开(公告)号:CN111508505B
公开(公告)日:2023-11-03
申请号:CN202010349219.8
申请日:2020-04-28
Applicant: 讯飞智元信息科技有限公司
Abstract: 本申请提供了一种说话人识别方法、装置、设备及存储介质,其中,方法包括:以趋于由混合高斯模型针对待识别语音确定的说话人特征为获取方向,从待识别语音中获取目标说话人特征,其中,混合高斯模型采用多个说话人的多条语音数据训练得到,混合高斯模型能够对语音数据中说话人个性特征的分布进行描述;根据目标说话人特征,识别待识别语音对应的说话人。本申请提供的说话人识别方法能够准确地识别出待识别语音对应的说话人。
-
-