-
公开(公告)号:CN113921041B
公开(公告)日:2024-10-29
申请号:CN202111183247.8
申请日:2021-10-11
Applicant: 山东省计算中心(国家超级计算济南中心)
IPC: G10L25/51 , G10L25/30 , G10L25/18 , G06F18/213 , G06F18/2415 , G06N3/0464 , G06N3/08
Abstract: 本发明提出了基于分组卷积注意力网络的录音设备识别方法及系统,包括:利用第一分组卷积注意力网络对待测音频的非话语段进行检测,完成非话语段检测后,将待测音频的非话语段筛选出来,拼接为一个完整的非话语段音频;在非话语段中提取用来作为待测录音设备的固有轨迹的随机谱特性特征,基于上述特征,利用第二分组卷积注意力网络进行录音设备识别。基于分组卷积注意力网络分别用于非话语段检测与录音设备识别,在降低整个录音设备识别模型复杂度的同时保证其高效性。
-
公开(公告)号:CN113160844A
公开(公告)日:2021-07-23
申请号:CN202110459982.0
申请日:2021-04-27
Applicant: 山东省计算中心(国家超级计算济南中心)
Abstract: 本发明公开了基于噪声背景分类的语音增强方法及系统,包括:获取待处理语音信号;对待处理语音信号进行特征提取;将提取的特征,输入到训练后的分类器中,得到待处理语音的噪声背景标签;根据噪声背景标签,选择对应标签的训练后的生成器;将待处理的语音信号,输入到被选中的训练后的生成器中,得到增强后的语音信号。本方法选择了提取带噪语音的梅尔频率倒谱系数输入分类器对噪声背景进行分类,对分类好的语音使用同一个模型内针对此类噪声背景的生成对抗网络来实现语音增强,此方法在面对多场景下的语音增强都有较好的效果。
-
公开(公告)号:CN112581929A
公开(公告)日:2021-03-30
申请号:CN202011450095.9
申请日:2020-12-11
Applicant: 山东省计算中心(国家超级计算济南中心)
IPC: G10K11/175 , G06N3/04 , G06N3/08
Abstract: 本申请公开了基于生成对抗网络的语音私密度掩蔽信号生成方法及系统,包括:生成随机噪声信号;将随机噪声信号输入到训练后的生成对抗网络中,训练后的生成对抗网络的生成器,生成保护语音私密度的掩蔽信号。此掩蔽信号与会议室内说话人发音特点类似,自然度更高且对窃听人员来说掩蔽信号的内容没有实际意义,从而达到对窃听者进行干扰的目的。该发明不但解决了常见的掩蔽信号掩蔽效率低、会对说话人有负面影响的问题,同时也节约了人力、物力,具有更高的环境适应性。
-
公开(公告)号:CN114649003B
公开(公告)日:2025-05-09
申请号:CN202210268697.5
申请日:2022-03-18
Applicant: 山东省计算中心(国家超级计算济南中心)
Abstract: 本发明属于通信技术领域,提供了基于语音同步和模式转移的多模态加密、解密方法及装置,通过对输入的语音进行语音段检测,采用一段一密的加密方案以此达到更高的加密强度的同时,增强对信道噪声和误码的鲁棒性;采用语音段线谱频率参数平均值作为模态选择的依据,增强模式选择的多样性,同时可以抵抗各种语音压缩传输算法的压缩。
-
公开(公告)号:CN113409827B
公开(公告)日:2022-06-17
申请号:CN202110673028.1
申请日:2021-06-17
Applicant: 山东省计算中心(国家超级计算济南中心)
IPC: G10L25/87 , G10L25/30 , G10L25/18 , G06N3/08 , G06N3/04 , G06K9/62 , G06K9/00 , G06F16/583 , G06F16/51
Abstract: 本发明属于语音信号处理领域,提供了一种基于局部卷积块注意力网络的语音端点检测方法及系统。该方法包括,获取语音数据的声谱图数据;利用局部敏感哈希算法为声谱图数据中的每一帧数据提取N个近邻帧,得到帧级的局部声谱图数据;将局部声谱图数据输入局部卷积块注意力网络中,经过卷积模块进行特征提取,在每个卷积块之后依次通过通道注意力模块、频谱注意力模块以及时间注意力模块进行注意力操作,得到增强的数据;将增强的数据输入分类器中,进行语音/非语音帧检测,得到预测结果。
-
-
-
-