识别语音信号中所承载的情感状态的方法和系统

    公开(公告)号:CN102637433A

    公开(公告)日:2012-08-15

    申请号:CN201110037314.5

    申请日:2011-02-09

    Abstract: 公开了一种生成语音情感模型的方法、设备以及识别语音信号中所承载的情感状态的方法、设备。生成语音情感模型的方法包括以下步骤:通过无监督聚类将标注为同一情感状态的多个情感语音样本聚类成n个子类,每个子类对应于同一情感状态的不同情感表达方式中的一种情感表达方式;以及为每个子类中的情感语音样本生成一个语音情感模型,从而得到分别对应于n个子类的n个语音情感模型,n个语音情感模型用于识别语音信号所承载的不同情感表达方式的情感状态,其中,n为大于或等于2的整数。

    一种基于循环损失的语音转换方法及装置

    公开(公告)号:CN114283824A

    公开(公告)日:2022-04-05

    申请号:CN202210201058.7

    申请日:2022-03-02

    Abstract: 本发明提供一种基于循环损失的语音转换方法及装置,所述方法包括:获取不同说话人的语音信息;将所述语音信息输入至训练好的语音转换模型中,基于所述语音转换模型的共享编码器和解码器转换为重构语音信息;获取所述重构语音与语音信息之间的循环损失,并基于所述循环损失对所述语音信息进行语音内容信息以及说话人风格信息的分离;其中,所述语音转换模型是基于不同语音样本以及样本的语音转换结果训练得到的。本发明能够基于循环损失实现语音内容信息以及说话人风格信息的分离,从而提高了语音转换的效率和语音转换质量。

    一种基于循环损失的语音转换方法及装置

    公开(公告)号:CN114283824B

    公开(公告)日:2022-07-08

    申请号:CN202210201058.7

    申请日:2022-03-02

    Abstract: 本发明提供一种基于循环损失的语音转换方法及装置,所述方法包括:获取不同说话人的语音信息;将所述语音信息输入至训练好的语音转换模型中,基于所述语音转换模型的共享编码器和解码器转换为重构语音信息;获取所述重构语音与语音信息之间的循环损失,并基于所述循环损失对所述语音信息进行语音内容信息以及说话人风格信息的分离;其中,所述语音转换模型是基于不同语音样本以及样本的语音转换结果训练得到的。本发明能够基于循环损失实现语音内容信息以及说话人风格信息的分离,从而提高了语音转换的效率和语音转换质量。

    识别语音信号中所承载的情感状态的方法和系统

    公开(公告)号:CN102637433B

    公开(公告)日:2015-11-25

    申请号:CN201110037314.5

    申请日:2011-02-09

    Abstract: 公开了一种生成语音情感模型的方法、设备以及识别语音信号中所承载的情感状态的方法、设备。生成语音情感模型的方法包括以下步骤:通过无监督聚类将标注为同一情感状态的多个情感语音样本聚类成n个子类,每个子类对应于同一情感状态的不同情感表达方式中的一种情感表达方式;以及为每个子类中的情感语音样本生成一个语音情感模型,从而得到分别对应于n个子类的n个语音情感模型,n个语音情感模型用于识别语音信号所承载的不同情感表达方式的情感状态,其中,n为大于或等于2的整数。

    基于类脑感知和决策的伪造语音检测方法、装置及设备

    公开(公告)号:CN117133295B

    公开(公告)日:2023-12-29

    申请号:CN202311379225.8

    申请日:2023-10-24

    Abstract: 本申请涉及语音检测技术领域,特别涉及一种基于类脑感知和决策的伪造语音检测方法、装置及设备,包括:若待检测语音中存在至少一个伪造痕迹,则对每个伪造痕迹进行信息编码,基于信息编码确定每个伪造痕迹对应的伪造信息检测元,并将每个伪造痕迹分别输入至每个伪造痕迹对应的伪造信息检测元得到每个伪造痕迹的感知结果,计算感知结果对应的置信度分数,将置信度分数转换为刺激信息,基于置信度分数和刺激信息得到每个伪造信息检测元的信息值;根据每个伪造信息检测元的信息值判定待检测语音为是否为伪造语音。由此,解决了相关技术中的伪造语音检测算法过于依赖数据,缺少泛化性,检测结果缺少可解释性的问题,提高了检测方法的普适性、泛化性。

    基于类脑感知和决策的伪造语音检测方法、装置及设备

    公开(公告)号:CN117133295A

    公开(公告)日:2023-11-28

    申请号:CN202311379225.8

    申请日:2023-10-24

    Abstract: 本申请涉及语音检测技术领域,特别涉及一种基于类脑感知和决策的伪造语音检测方法、装置及设备,包括:若待检测语音中存在至少一个伪造痕迹,则对每个伪造痕迹进行信息编码,基于信息编码确定每个伪造痕迹对应的伪造信息检测元,并将每个伪造痕迹分别输入至每个伪造痕迹对应的伪造信息检测元得到每个伪造痕迹的感知结果,计算感知结果对应的置信度分数,将置信度分数转换为刺激信息,基于置信度分数和刺激信息得到每个伪造信息检测元的信息值;根据每个伪造信息检测元的信息值判定待检测语音为是否为伪造语音。由此,解决了相关技术中的伪造语音检测算法过于依赖数据,缺少泛化性,检测结果缺少可解释性的问题,提高了检测方法的普适性、泛化性。

Patent Agency Ranking