一种基于语义通信的远程语音增强传输方法及系统

    公开(公告)号:CN119296566B

    公开(公告)日:2025-05-16

    申请号:CN202411845049.7

    申请日:2024-12-16

    Abstract: 本发明公开了语音信号传输处理技术领域的一种基于语义通信的远程语音增强传输方法及系统,系统包括:本地发送端,用于:对待增强的含噪语音信号进行短时傅里叶变换后,利用语义编码器对含噪语音信号频谱进行语义特征提取;然后利用信道编码器对语音语义特征进行维度调整;最后通过信道传输至远程接收端;远程接收端,用于:接收通过信道传输过来的语音语义特征信号;利用信道解码器对接收到的语音语义特征信号进行维度恢复后,利用语义解码器进行语义解码得到预测纯净语音信号的实部与虚部,最后进行逆短时傅里叶变换得到重构语音信号。本发明可以在节约通信资源的情况下,显著提高远程接收端在低信噪比信道传输条件下恢复的纯净语音质量。

    一种基于语义通信的远程语音增强传输方法及系统

    公开(公告)号:CN119296566A

    公开(公告)日:2025-01-10

    申请号:CN202411845049.7

    申请日:2024-12-16

    Abstract: 本发明公开了语音信号传输处理技术领域的一种基于语义通信的远程语音增强传输方法及系统,系统包括:本地发送端,用于:对待增强的含噪语音信号进行短时傅里叶变换后,利用语义编码器对含噪语音信号频谱进行语义特征提取;然后利用信道编码器对语音语义特征进行维度调整;最后通过信道传输至远程接收端;远程接收端,用于:接收通过信道传输过来的语音语义特征信号;利用信道解码器对接收到的语音语义特征信号进行维度恢复后,利用语义解码器进行语义解码得到预测纯净语音信号的实部与虚部,最后进行逆短时傅里叶变换得到重构语音信号。本发明可以在节约通信资源的情况下,显著提高远程接收端在低信噪比信道传输条件下恢复的纯净语音质量。

    一种端到端的深度伪造语音检测系统及方法

    公开(公告)号:CN119694320A

    公开(公告)日:2025-03-25

    申请号:CN202510200876.9

    申请日:2025-02-24

    Abstract: 本发明公开了一种端到端的深度伪造语音检测系统及方法,属于语音处理技术领域。其检测系统分为前端嵌入提取网络和后端分类网络两部分。前端嵌入提取网络采用前端预训练模型来提取语音信号的不同尺度的全局语义特征,并采用特征融合模块对提取的不同尺度的全局语义特征进行深度融合,进一步增强特征嵌入的表达能力。后端分类网络采用单层长短期记忆分类网络对融合特征进行分类,并使用交叉熵损失和中心损失进行联合优化,最终判断语音是真实的还是伪造的。本发明应用于语音安全、身份认证、语音助手等场景中,能够提供更加准确、鲁棒和具有良好泛化能力的深度伪造语音检测方案,对于提升语音识别系统的安全性和可信度,具有重要意义。

    一种基于语义通信的远程说话人确认方法及系统

    公开(公告)号:CN118782051B

    公开(公告)日:2025-02-07

    申请号:CN202411283783.9

    申请日:2024-09-13

    Abstract: 本发明公开了一种基于语义通信的远程说话人确认方法及系统,具体涉及语音信号传输处理技术领域,其包括本地发送端编码和远程接收端解码两部分,本地发送端编码包括对原始语音信号的频谱进行语义特征提取,得到说话人语义特征,然后进行说话人语义特征维度调整,最后通过信道传输至远程接收端;远程接收端解码包括:接收本地发送端传输的维度调整后的说话人语义特征信号;对维度调整后的说话人语义特征信号进行维度恢复及归一化处理,得到说话人嵌入特征;将说话人嵌入特征与目标说话人嵌入特征进行比较,判断说话人是否为目标说话人。本发明可以在节约通信资源的情况下,提高低信噪比时说话人确认任务的可靠性和准确性。

    一种基于语义通信的远程说话人确认方法及系统

    公开(公告)号:CN118782051A

    公开(公告)日:2024-10-15

    申请号:CN202411283783.9

    申请日:2024-09-13

    Abstract: 本发明公开了一种基于语义通信的远程说话人确认方法及系统,具体涉及语音信号传输处理技术领域,其包括本地发送端编码和远程接收端解码两部分,本地发送端编码包括对原始语音信号的频谱进行语义特征提取,得到说话人语义特征,然后进行说话人语义特征维度调整,最后通过信道传输至远程接收端;远程接收端解码包括:接收本地发送端传输的维度调整后的说话人语义特征信号;对维度调整后的说话人语义特征信号进行维度恢复及归一化处理,得到说话人嵌入特征;将说话人嵌入特征与目标说话人嵌入特征进行比较,判断说话人是否为目标说话人。本发明可以在节约通信资源的情况下,提高低信噪比时说话人确认任务的可靠性和准确性。

Patent Agency Ranking