基于多尺度残差注意力的语音压缩方法及系统

    公开(公告)号:CN118335092A

    公开(公告)日:2024-07-12

    申请号:CN202410748437.7

    申请日:2024-06-12

    Abstract: 本发明属于语音信号处理技术领域,提供了一种基于多尺度残差注意力的语音压缩方法及系统,包括获取语音信号;对语音信号进行卷积操作,得到第一特征,对第一特征进行操作,得到第一特征的残差和恒等映射;将残差和恒等映射相加得到第一输出特征,对第一输出特征进行特征提取,经过多次操作得到注意力分数,将注意力分数分别与残差和恒等映射相乘,经过多次操作得到第三输出特征;对第三输出特征进行多级迭代量化,得到第一矢量,第二网络根据接收到的第一矢量的索引,在码本中找到相应的量化矢量,将所有量化矢量相加,得到重构矢量;对重构矢量解码输出合成语音,并对生成语音的真伪通过判别器进行判断。本发明能够提高合成语音的质量。

    基于声波通讯的数据传输方法及系统

    公开(公告)号:CN113543295B

    公开(公告)日:2023-11-07

    申请号:CN202110719226.7

    申请日:2021-06-28

    Abstract: 本发明公开了基于声波通讯的数据传输方法及系统,包括一发送设备和至少一接收设备,所述任一接收设备均具有唯一的ID,且所述发送设备和所述接收设备均具有声音播放和拾取功能,所述数据传输方法包括以下步骤:首先,一探测设备帧首先被所述发送设备周期性地发送,所述接收设备如果接收到该探测设备帧,则所述接收设备会向所述发送设备回复一探测应答帧;其次,所述发送设备发送的数据帧中记载有帧号和该接收设备ID,相邻数据帧的帧号是连续的;最后,所述接收设备将所有缺少和数据校验错误数据帧的帧号发送给所述发送设备,所述发送设备重传,直到所有数据帧被所述接收设备正确地接收。本发明有效地提高了数据通讯的波特率。

    基于生成对抗网络的语音私密度掩蔽信号生成方法及系统

    公开(公告)号:CN112581929B

    公开(公告)日:2022-06-03

    申请号:CN202011450095.9

    申请日:2020-12-11

    Abstract: 本申请公开了基于生成对抗网络的语音私密度掩蔽信号生成方法及系统,包括:生成随机噪声信号;将随机噪声信号输入到训练后的生成对抗网络中,训练后的生成对抗网络的生成器,生成保护语音私密度的掩蔽信号。此掩蔽信号与会议室内说话人发音特点类似,自然度更高且对窃听人员来说掩蔽信号的内容没有实际意义,从而达到对窃听者进行干扰的目的。该发明不但解决了常见的掩蔽信号掩蔽效率低、会对说话人有负面影响的问题,同时也节约了人力、物力,具有更高的环境适应性。

Patent Agency Ranking