-
公开(公告)号:CN109448739A
公开(公告)日:2019-03-08
申请号:CN201811524849.3
申请日:2018-12-13
Applicant: 山东省计算中心(国家超级计算济南中心)
IPC: G10L19/00 , G10L19/02 , G10L19/032
Abstract: 本发明公开了一种基于分层聚类的声码器线谱频率参数量化方法,包括:接收语音信号并按帧提取线谱频率参数和清浊音参数;将连续若干帧的线谱频率参数和清浊音参数分别联合,组成超帧线谱频率矢量和超帧清浊音矢量;对当前超帧清浊音矢量进行矢量量化,得到量化索引,其中,当前超帧和上一超帧对应的量化索引联合组成当前转移模式;分别计算该转移模式下的线谱频率参数的直流分量,并训练预测系数,得到该转移模式下当前超帧余量线谱频率参数;根据当前转移模式选择对应量化码本,对余量线谱频率参数进行多级矢量量化,得到量化后的余量线谱频率参数。该方法考虑了线谱频率参数在不同状态下的统计特性差异,能够提高线谱频率参数的量化质量。
-
公开(公告)号:CN109346093A
公开(公告)日:2019-02-15
申请号:CN201811541115.6
申请日:2018-12-17
Applicant: 山东省计算中心(国家超级计算济南中心)
IPC: G10L19/16 , G10L19/032 , G10L25/93
Abstract: 本公开公开了一种低速率声码器子带清浊音参数提取与量化的融合方法,该方法充分考虑了子带清浊音参数的统计和量化特性,采用在提取过程中不断进行失真比较和候选矢量淘汰的方法,减少需要搜索的候选矢量,尽快锁定目标矢量,进而提前结束分析和搜索过程。可以有效用于2400bps以下的低速率、超低速率语音编码算法中,实现减少低速率声码器算法复杂度、降低系统功耗的目的。
-
公开(公告)号:CN108900273A
公开(公告)日:2018-11-27
申请号:CN201810902321.9
申请日:2018-08-09
Applicant: 山东省计算中心(国家超级计算济南中心)
Abstract: 本发明公开了一种无线传感器网络多跳一致的时间同步方法,用于为大规模无线传感器网络提供精准的时间同步服务,所述方法包括如下内容:时间同步信息产生,时间基准源节点周期性广播带有时间信息和序列号信息的同步报文;时间同步信息扩散,节点在收到同步报文后进行转发,直到所有节点转发完成;时间同步信息计算,网络中节点收到新的同步信息报文,通过时间信息和延迟时间计算出当前节点接收同步报文的发送时间戳,获得实时有效时间信息。
-
公开(公告)号:CN108461088A
公开(公告)日:2018-08-28
申请号:CN201810232462.4
申请日:2018-03-21
Applicant: 山东省计算中心(国家超级计算济南中心)
IPC: G10L19/16 , G10L19/04 , G10L25/93 , G10L19/08 , G10L19/087
Abstract: 本发明的基于支持向量机在语音解码端重构子带清浊音度参数的方法,首先利用语音样本的5个子带清浊音度参数、声道参数、基音参数和能量参数训练出5个子带清浊音判决的支持向量机模型,在低速率声码器的解码端,利用线谱频率参数、基音周期参数、能量参数与子带清浊音度参数的相关性,对子带清浊音度参数进行重构。摒弃传统编码器中对子带清浊音度参数量化编码传输的方法,在声码器中引入支持向量机,利用线谱频率参数、基音周期参数和能量参数将子带清浊音度参数直接恢复出来,在不明显降低各子带清浊音判决准确率的前提下,节省的量化比特数,可用来量化其他更加重要的参数,整体上可以进一步提升合成语音的质量。
-
公开(公告)号:CN113921041B
公开(公告)日:2024-10-29
申请号:CN202111183247.8
申请日:2021-10-11
Applicant: 山东省计算中心(国家超级计算济南中心)
IPC: G10L25/51 , G10L25/30 , G10L25/18 , G06F18/213 , G06F18/2415 , G06N3/0464 , G06N3/08
Abstract: 本发明提出了基于分组卷积注意力网络的录音设备识别方法及系统,包括:利用第一分组卷积注意力网络对待测音频的非话语段进行检测,完成非话语段检测后,将待测音频的非话语段筛选出来,拼接为一个完整的非话语段音频;在非话语段中提取用来作为待测录音设备的固有轨迹的随机谱特性特征,基于上述特征,利用第二分组卷积注意力网络进行录音设备识别。基于分组卷积注意力网络分别用于非话语段检测与录音设备识别,在降低整个录音设备识别模型复杂度的同时保证其高效性。
-
公开(公告)号:CN115019833B
公开(公告)日:2024-09-17
申请号:CN202210852485.1
申请日:2022-07-20
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学
Abstract: 本发明提供一种基于时频特征和全局注意力的语音情感识别方法及系统,涉及语音信号处理与模式识别技术领域,该方法通过提取三维对数梅尔谱图的时间特征和频率特征,并进行分析处理,以充分利用语音信号的静态特征和动态特征,以及静态特征和动态特征之间的通道联系,得到更深层次的特征联系,丰富了特征维度;并且,提取时间维度和空间(频率)维度数据,将其进行融合;利用空间特征提取模块和全局上下文注意力模块对时间‑频率特征进行分析,充分利用语音信号所包含的空间特征和时间特征,并对融合后的特征进行通道间的特征进行分析,其分析的特征更为全面,从而可以提高情感识别结果的准确率。
-
公开(公告)号:CN113160844A
公开(公告)日:2021-07-23
申请号:CN202110459982.0
申请日:2021-04-27
Applicant: 山东省计算中心(国家超级计算济南中心)
Abstract: 本发明公开了基于噪声背景分类的语音增强方法及系统,包括:获取待处理语音信号;对待处理语音信号进行特征提取;将提取的特征,输入到训练后的分类器中,得到待处理语音的噪声背景标签;根据噪声背景标签,选择对应标签的训练后的生成器;将待处理的语音信号,输入到被选中的训练后的生成器中,得到增强后的语音信号。本方法选择了提取带噪语音的梅尔频率倒谱系数输入分类器对噪声背景进行分类,对分类好的语音使用同一个模型内针对此类噪声背景的生成对抗网络来实现语音增强,此方法在面对多场景下的语音增强都有较好的效果。
-
公开(公告)号:CN112581929A
公开(公告)日:2021-03-30
申请号:CN202011450095.9
申请日:2020-12-11
Applicant: 山东省计算中心(国家超级计算济南中心)
IPC: G10K11/175 , G06N3/04 , G06N3/08
Abstract: 本申请公开了基于生成对抗网络的语音私密度掩蔽信号生成方法及系统,包括:生成随机噪声信号;将随机噪声信号输入到训练后的生成对抗网络中,训练后的生成对抗网络的生成器,生成保护语音私密度的掩蔽信号。此掩蔽信号与会议室内说话人发音特点类似,自然度更高且对窃听人员来说掩蔽信号的内容没有实际意义,从而达到对窃听者进行干扰的目的。该发明不但解决了常见的掩蔽信号掩蔽效率低、会对说话人有负面影响的问题,同时也节约了人力、物力,具有更高的环境适应性。
-
公开(公告)号:CN108461088B
公开(公告)日:2019-11-19
申请号:CN201810232462.4
申请日:2018-03-21
Applicant: 山东省计算中心(国家超级计算济南中心)
IPC: G10L19/16 , G10L19/04 , G10L25/93 , G10L19/08 , G10L19/087
Abstract: 本发明的基于支持向量机在语音解码端重构子带清浊音度参数的方法,首先利用语音样本的5个子带清浊音度参数、声道参数、基音参数和能量参数训练出5个子带清浊音判决的支持向量机模型,在低速率声码器的解码端,利用线谱频率参数、基音周期参数、能量参数与子带清浊音度参数的相关性,对子带清浊音度参数进行重构。摒弃传统编码器中对子带清浊音度参数量化编码传输的方法,在声码器中引入支持向量机,利用线谱频率参数、基音周期参数和能量参数将子带清浊音度参数直接恢复出来,在不明显降低各子带清浊音判决准确率的前提下,节省的量化比特数,可用来量化其他更加重要的参数,整体上可以进一步提升合成语音的质量。
-
公开(公告)号:CN109616143A
公开(公告)日:2019-04-12
申请号:CN201811526264.5
申请日:2018-12-13
Applicant: 山东省计算中心(国家超级计算济南中心)
IPC: G10L25/87
Abstract: 本发明公开了一种基于变分模态分解和感知哈希的语音端点检测方法,该方法包括:接收输入语音信号;将输入语音信号进行VMD分解,将VMD分解后的固有模态函数分别进行短时时频分析,得到时频分析矩阵,根据感知哈希算法计算时频分析矩阵的感知哈希值;将输入语音信号VMD分解后时频分析矩阵的感知哈希值与环境噪声VMD分解后时频分析矩阵的感知哈希值进行比较,判断输入语音信号的语音段和噪声段。
-
-
-
-
-
-
-
-
-