一种基于LDA的文本无关声纹识别方法

    公开(公告)号:CN111081261A

    公开(公告)日:2020-04-28

    申请号:CN201911356454.1

    申请日:2019-12-25

    Abstract: 本发明涉及一种基于LDA的文本无关声纹识别方法,包括:S1,提取待识别语音样本的声学特征序列,计算所述声学特征序列在预先构建的声学特征分布空间中的分布特征矢量;S2,对所述分布特征矢量进行模规整,使用LDA对模规整后的分布特征矢量进行降维;S3,计算降维后的分布特征矢量与预先构建的基于模规整和LDA映射分布特征的文本无关说话人声纹模型之间的似然度,将似然度最大的文本无关说话人声纹模型对应的声纹作为识别结果。本发明使用LDA对待识别语音以及语音样本的分布特征矢量中的文本内容信息进行补偿,减少文本内容不同带来的干扰。

    一种基于跨梯度训练的情感说话人认证方法

    公开(公告)号:CN114357414B

    公开(公告)日:2024-04-02

    申请号:CN202111483807.1

    申请日:2021-12-07

    Abstract: 本发明公开了一种基于跨梯度训练的情感说话人认证方法,该方法的步骤包括:基于x‑vector系统结合多任务学习搭建网络模型;对训练语音提取声学特征;随机挑选一批训练语音样本的特征序列作为网络输入,同时进行情感分类和说话人分类,通过两个任务的联合损失调整网络参数;利用情感分类部分的损失函数更新特征序列;进行跨梯度训练,再次调整说话人分类部分的网络参数;网络训练完成后设定认证阈值即可进行说话人认证。针对说话人认证系统在注册语音和测试语音情感不匹配时性能下降的问题,结合多任务学习,本发明利用跨梯度训练,对训练数据的情感信息进行扩充,提高了情感语音的说话人认证性能,缓解了在小数据量训练集上的过拟合程度。

    一种基于运动轨迹和区分性信息的语音关键词检测方法

    公开(公告)号:CN114373453B

    公开(公告)日:2024-06-04

    申请号:CN202111460052.3

    申请日:2021-12-02

    Abstract: 本发明公开了一种基于运动轨迹和区分性信息的语音关键词检测方法,该方法步骤包括:构建关键词特征空间运动轨迹;针对关键词声学相近词对比构建关键词局部区分性信息;利用待检测音段特征空间分布与关键词特征空间分布知识的相似性预选可能的关键词子集,同时检测待检测音段音节数与关键词音节数是否匹配,利用待检测音段特征空间运动轨迹与预选关键词子集中每个词的特征空间运动轨迹相似度选出最可能的关键词,有声学相似竞争者时利用其局部区分性信息甄别确定最后检测结果,本发明利用关键词时序信息和局部区分性信息有效提高在训练数据较少时的关键词检出性能,对音频样本基于音节切分算法划分匹配段使得匹配段语义信息完整,有利于关键词的检出。

    一种基于LDA的文本无关声纹识别方法

    公开(公告)号:CN111081261B

    公开(公告)日:2023-04-21

    申请号:CN201911356454.1

    申请日:2019-12-25

    Abstract: 本发明涉及一种基于LDA的文本无关声纹识别方法,包括:S1,提取待识别语音样本的声学特征序列,计算所述声学特征序列在预先构建的声学特征分布空间中的分布特征矢量;S2,对所述分布特征矢量进行模规整,使用LDA对模规整后的分布特征矢量进行降维;S3,计算降维后的分布特征矢量与预先构建的基于模规整和LDA映射分布特征的文本无关说话人声纹模型之间的似然度,将似然度最大的文本无关说话人声纹模型对应的声纹作为识别结果。本发明使用LDA对待识别语音以及语音样本的分布特征矢量中的文本内容信息进行补偿,减少文本内容不同带来的干扰。

    一种基于运动轨迹和区分性信息的语音关键词检测方法

    公开(公告)号:CN114373453A

    公开(公告)日:2022-04-19

    申请号:CN202111460052.3

    申请日:2021-12-02

    Abstract: 本发明公开了一种基于运动轨迹和区分性信息的语音关键词检测方法,该方法步骤包括:构建关键词特征空间运动轨迹;针对关键词声学相近词对比构建关键词局部区分性信息;利用待检测音段特征空间分布与关键词特征空间分布知识的相似性预选可能的关键词子集,同时检测待检测音段音节数与关键词音节数是否匹配,利用待检测音段特征空间运动轨迹与预选关键词子集中每个词的特征空间运动轨迹相似度选出最可能的关键词,有声学相似竞争者时利用其局部区分性信息甄别确定最后检测结果,本发明利用关键词时序信息和局部区分性信息有效提高在训练数据较少时的关键词检出性能,对音频样本基于音节切分算法划分匹配段使得匹配段语义信息完整,有利于关键词的检出。

    一种基于跨梯度训练的情感说话人认证方法

    公开(公告)号:CN114357414A

    公开(公告)日:2022-04-15

    申请号:CN202111483807.1

    申请日:2021-12-07

    Abstract: 本发明公开了一种基于跨梯度训练的情感说话人认证方法,该方法的步骤包括:基于x‑vector系统结合多任务学习搭建网络模型;对训练语音提取声学特征;随机挑选一批训练语音样本的特征序列作为网络输入,同时进行情感分类和说话人分类,通过两个任务的联合损失调整网络参数;利用情感分类部分的损失函数更新特征序列;进行跨梯度训练,再次调整说话人分类部分的网络参数;网络训练完成后设定认证阈值即可进行说话人认证。针对说话人认证系统在注册语音和测试语音情感不匹配时性能下降的问题,结合多任务学习,本发明利用跨梯度训练,对训练数据的情感信息进行扩充,提高了情感语音的说话人认证性能,缓解了在小数据量训练集上的过拟合程度。

Patent Agency Ranking