-
公开(公告)号:CN115019833A
公开(公告)日:2022-09-06
申请号:CN202210852485.1
申请日:2022-07-20
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学
Abstract: 本发明提供一种基于时频特征和全局注意力的语音情感识别方法及系统,涉及语音信号处理与模式识别技术领域,该方法通过提取三维对数梅尔谱图的时间特征和频率特征,并进行分析处理,以充分利用语音信号的静态特征和动态特征,以及静态特征和动态特征之间的通道联系,得到更深层次的特征联系,丰富了特征维度;并且,提取时间维度和空间(频率)维度数据,将其进行融合;利用空间特征提取模块和全局上下文注意力模块对时间‑频率特征进行分析,充分利用语音信号所包含的空间特征和时间特征,并对融合后的特征进行通道间的特征进行分析,其分析的特征更为全面,从而可以提高情感识别结果的准确率。
-
公开(公告)号:CN114649003A
公开(公告)日:2022-06-21
申请号:CN202210268697.5
申请日:2022-03-18
Applicant: 山东省计算中心(国家超级计算济南中心)
Abstract: 本发明属于通信技术领域,提供了基于语音同步和模式转移的多模态加密、解密方法及装置,通过对输入的语音进行语音段检测,采用一段一密的加密方案以此达到更高的加密强度的同时,增强对信道噪声和误码的鲁棒性;采用语音段线谱频率参数平均值作为模态选择的依据,增强模式选择的多样性,同时可以抵抗各种语音压缩传输算法的压缩。
-
公开(公告)号:CN107154256A
公开(公告)日:2017-09-12
申请号:CN201710503021.9
申请日:2017-06-27
Applicant: 山东省计算中心(国家超级计算济南中心)
IPC: G10K11/175 , G01S5/22
CPC classification number: G10K11/175 , G01S5/22
Abstract: 本发明的基于声源定位的声掩蔽系统,包括语音采集电路、中央处理单元、噪声发生模块、运放电路、幅度可调电路、功放电路和终端;语音采集电路由多路MIC组成,ARM处理器经控制总线接口与幅度可调电路相连接,以调整输出的噪声干扰信号的幅度。本发明的自适应调整方法,首先确定出声源的坐标,再根据终端与声源的距离计算出每个终端处的声压强度,再根据防护信噪比确定每个终端应输出的干扰噪声的强度。本发明应用在保密会议室的声掩蔽系统中,能够从根本上优化声掩蔽系统的防护效果,以最小的噪声干扰获取最佳的防窃听效果,从根本上对声掩蔽系统的防护效果和干扰效果进行了优化,一定程度上减少掩蔽声的噪声污染。
-
公开(公告)号:CN104661170A
公开(公告)日:2015-05-27
申请号:CN201510101743.2
申请日:2015-03-09
Applicant: 山东省计算中心(国家超级计算济南中心)
Abstract: 本发明的多音箱故障检测系统,特征在于:包括差分放大电路、第二级运放电路、电压比较器和故障报警电路,差分放大电路的两信号端串联于多音箱的音频回路中,整流滤波电路对第二级运放电路输出的信号整流、滤波后,输入至电压比较器的同相输入端,电压比较器的反相输入端经电位器接于电源上;通过调节电压比较器反相输入端上的电位器,使故障报警电路恰好不发生报警;当有音箱发生故障而断路时,会使输入至差分放大电路中的差分信号减小,而得电压比较器的输出电平发生翻转而触发报警。本系统电路简单,成本低廉,安装方便,只需要将此装置串联接入音箱即可工作。可安装到总控制室,也可以安装到每个音箱上,可以实时检测是否有音箱损。
-
公开(公告)号:CN114649003B
公开(公告)日:2025-05-09
申请号:CN202210268697.5
申请日:2022-03-18
Applicant: 山东省计算中心(国家超级计算济南中心)
Abstract: 本发明属于通信技术领域,提供了基于语音同步和模式转移的多模态加密、解密方法及装置,通过对输入的语音进行语音段检测,采用一段一密的加密方案以此达到更高的加密强度的同时,增强对信道噪声和误码的鲁棒性;采用语音段线谱频率参数平均值作为模态选择的依据,增强模式选择的多样性,同时可以抵抗各种语音压缩传输算法的压缩。
-
公开(公告)号:CN118016081A
公开(公告)日:2024-05-10
申请号:CN202410423860.X
申请日:2024-04-10
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学(山东省科学院)
Abstract: 本公开提供了基于语音质量分级模型的变速率语音编码方法及系统,涉及语音信号处理技术领域,包括:获取编码器不同误码率下得到的合成语音文件;将所述合成语音文件输入至语音质量分级模型中,得到语音质量的预测结果;对未来可能出现的语音质量的变化情况进行模态划分;其中,语音质量的变化情况包括三种模态,分别为平衡态、休眠态以及激活态;判断当前预测出的语音质量的所属模态,并根据当前所属模态,实时地对语音编码的速率进行自适应调整,在语音编码的自然度、可懂度和系统容量间得到最佳平衡。
-
公开(公告)号:CN117423348A
公开(公告)日:2024-01-19
申请号:CN202311743425.7
申请日:2023-12-19
Applicant: 山东省计算中心(国家超级计算济南中心)
Abstract: 本公开提供了基于深度学习和矢量预测的语音压缩方法及系统,涉及语音信号处理技术领域,包括:获取低速率下的多帧语音信号,并预处理为语音序列;将当前帧语音序列作为第一深度网络的输入信号提取声学特征,利用所述声学特征预测下一帧语音序列的声学特征,并作为预测矢量;对原声学特征与预测矢量作差,获取差值矢量,并在设计的码本中寻找与差值矢量最匹配的量化矢量,作为残差索引传输到第二深度网络,第二深度网络根据接收的残差索引,在码本中找到相应的差值量化矢量,将差值量化矢量与预测矢量相加,得到重构矢量,对所述重构矢量解码输出合成语音,本公开提高了语音压缩编码合成的质量。
-
公开(公告)号:CN115881164A
公开(公告)日:2023-03-31
申请号:CN202211490561.5
申请日:2022-11-25
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学
Abstract: 本发明公开了一种语音情感识别方法、系统、电子设备及计算机可读存储介质,属于语音信号处理与模式识别技术领域。包括获取语音信号并进行预处理,对预处理后的语音信号进行声学特征提取,对提取到的声学特征数据进行标准化处理;将标准化处理后的声学特征数据输入训练好的语音情感识别模型进行处理并分类,获取语音情感识别结果;其中,语音情感识别模型包括长短期记忆网络、编码器、双向长短期记忆网络和SoftMax分类模块。能够避免在输入到神经网络中时丢失时间信息,充分提取和处理时序特征;解决了现有技术中存在“有较好的运用语音的情感声学特征,尤其是时间序列的特征,出现梯度消失和信息损失”的问题。
-
公开(公告)号:CN113409827B
公开(公告)日:2022-06-17
申请号:CN202110673028.1
申请日:2021-06-17
Applicant: 山东省计算中心(国家超级计算济南中心)
IPC: G10L25/87 , G10L25/30 , G10L25/18 , G06N3/08 , G06N3/04 , G06K9/62 , G06K9/00 , G06F16/583 , G06F16/51
Abstract: 本发明属于语音信号处理领域,提供了一种基于局部卷积块注意力网络的语音端点检测方法及系统。该方法包括,获取语音数据的声谱图数据;利用局部敏感哈希算法为声谱图数据中的每一帧数据提取N个近邻帧,得到帧级的局部声谱图数据;将局部声谱图数据输入局部卷积块注意力网络中,经过卷积模块进行特征提取,在每个卷积块之后依次通过通道注意力模块、频谱注意力模块以及时间注意力模块进行注意力操作,得到增强的数据;将增强的数据输入分类器中,进行语音/非语音帧检测,得到预测结果。
-
公开(公告)号:CN110473563A
公开(公告)日:2019-11-19
申请号:CN201910763627.5
申请日:2019-08-19
Applicant: 山东省计算中心(国家超级计算济南中心)
IPC: G10L21/0208 , G10L21/0216 , G10L25/03 , G10L25/45
Abstract: 本公开公开了基于时频特征的呼吸声检测方法、系统、设备及介质,包括:获取待检测的语音信号;所述待检测的语音信号是由飞行在高空的飞机上的工作人员发出的,且传输给地面接收员的语音信号;对待检测的语音信号进行加窗分帧处理,得到若干帧语音信号;对每一帧语音信号进行特征提取,提取短时过零率、高低频短时能量比和低中频短时能量比;如果当前帧语音信号的短时过零率大于第一设定阈值,且高低频短时能量比大于第二设定阈值;则判定当前帧语音信号为呼吸声,对呼吸声进行消除。合利用短时过零率、短时能量、高低频短时能量比等特征参数,检测传输语音中的呼吸声,并对检测到的呼吸声进行后处理,改善听觉效果。
-
-
-
-
-
-
-
-
-