基于生成对抗网络的语音处理方法及系统

    公开(公告)号:CN113096673A

    公开(公告)日:2021-07-09

    申请号:CN202110341574.5

    申请日:2021-03-30

    Abstract: 本发明属于语音处理领域,提供了一种基于生成对抗网络的语音处理方法及系统。其中,该方法包括获取源语音,并输入至编码器对源语音进行编码;将编码后的语音信号输入至生成对抗网络模型,最后输出与源语音相匹配的恢复的语音;其中,生成对抗网络模型包括生成器和鉴别器,训练集由编码前的源语音和编码后质量下降的语音构成;生成器用于恢复编码后质量下降的语音;鉴别器用于比对恢复后的语音与编码前的源语音以区分真信号与假信号,再由鉴别器将区分结果反馈给生成器,以指导生成器学习源语音的真实分布的输出。解决了语音编码器生成的语音质量较低的问题,并且具有更高的泛化性,对多种ITU标准下的编码器生成的编解码后的语音都有效。

    一种多声掩蔽系统信息中心化管理系统及方法

    公开(公告)号:CN111508461B

    公开(公告)日:2023-11-03

    申请号:CN202010284793.X

    申请日:2020-04-13

    Abstract: 本发明公开了一种多声掩蔽系统信息中心化管理系统及方法,包括:控制器、信息中心化管理设备以及分别与所述信息中心化管理设备连接的至少两个声掩蔽系统,每一个声掩蔽系统包括声掩蔽系统控制器以及与其连接的至少一个声掩蔽系统负载;所述信息中心化管理设备被配置为对各声掩蔽系统进行参数配置;并且,接收各声掩蔽系统上传的工作状态数据,对所述工作状态数据进行分类,按照各数据分类的优先级别发送至控制器。本发明可根据防护区域的大小进行灵活扩展,实现多声掩蔽系统的协同防护;可以方便获取需防护区域防护参数,并进行灵活配置声掩蔽系统的数量以及位置。

    一种语音情感识别方法及系统
    49.
    发明公开

    公开(公告)号:CN115881164A

    公开(公告)日:2023-03-31

    申请号:CN202211490561.5

    申请日:2022-11-25

    Abstract: 本发明公开了一种语音情感识别方法、系统、电子设备及计算机可读存储介质,属于语音信号处理与模式识别技术领域。包括获取语音信号并进行预处理,对预处理后的语音信号进行声学特征提取,对提取到的声学特征数据进行标准化处理;将标准化处理后的声学特征数据输入训练好的语音情感识别模型进行处理并分类,获取语音情感识别结果;其中,语音情感识别模型包括长短期记忆网络、编码器、双向长短期记忆网络和SoftMax分类模块。能够避免在输入到神经网络中时丢失时间信息,充分提取和处理时序特征;解决了现有技术中存在“有较好的运用语音的情感声学特征,尤其是时间序列的特征,出现梯度消失和信息损失”的问题。

Patent Agency Ranking