-
公开(公告)号:CN113409827B
公开(公告)日:2022-06-17
申请号:CN202110673028.1
申请日:2021-06-17
Applicant: 山东省计算中心(国家超级计算济南中心)
IPC: G10L25/87 , G10L25/30 , G10L25/18 , G06N3/08 , G06N3/04 , G06K9/62 , G06K9/00 , G06F16/583 , G06F16/51
Abstract: 本发明属于语音信号处理领域,提供了一种基于局部卷积块注意力网络的语音端点检测方法及系统。该方法包括,获取语音数据的声谱图数据;利用局部敏感哈希算法为声谱图数据中的每一帧数据提取N个近邻帧,得到帧级的局部声谱图数据;将局部声谱图数据输入局部卷积块注意力网络中,经过卷积模块进行特征提取,在每个卷积块之后依次通过通道注意力模块、频谱注意力模块以及时间注意力模块进行注意力操作,得到增强的数据;将增强的数据输入分类器中,进行语音/非语音帧检测,得到预测结果。
-
公开(公告)号:CN113033490A
公开(公告)日:2021-06-25
申请号:CN202110443273.3
申请日:2021-04-23
Applicant: 山东省计算中心(国家超级计算济南中心)
Abstract: 本公开提供了一种基于声音信号的工业设备通用故障检测方法及系统,获取待识别的工业设备音频数据;将获取的音频数据输入到预设分类模型中,得到故障检测结果;其中,在基于Deep‑SVDD构建的预设分类模型中,提取梅尔频率倒谱系数特征和短时过零率特征,将获取的特征通过BP神经网络编码并计算编码后的向量距离超球体圆心的距离,依照距离得到检测评分,根据评分与预设阈值的对比得到故障检测结果;本公开利用基于Deep‑SVDD构建的预设分类模型,能够最大限度上模拟人的判断行为,实现了快速精准的故障检测。
-
公开(公告)号:CN110473563A
公开(公告)日:2019-11-19
申请号:CN201910763627.5
申请日:2019-08-19
Applicant: 山东省计算中心(国家超级计算济南中心)
IPC: G10L21/0208 , G10L21/0216 , G10L25/03 , G10L25/45
Abstract: 本公开公开了基于时频特征的呼吸声检测方法、系统、设备及介质,包括:获取待检测的语音信号;所述待检测的语音信号是由飞行在高空的飞机上的工作人员发出的,且传输给地面接收员的语音信号;对待检测的语音信号进行加窗分帧处理,得到若干帧语音信号;对每一帧语音信号进行特征提取,提取短时过零率、高低频短时能量比和低中频短时能量比;如果当前帧语音信号的短时过零率大于第一设定阈值,且高低频短时能量比大于第二设定阈值;则判定当前帧语音信号为呼吸声,对呼吸声进行消除。合利用短时过零率、短时能量、高低频短时能量比等特征参数,检测传输语音中的呼吸声,并对检测到的呼吸声进行后处理,改善听觉效果。
-
公开(公告)号:CN110221849A
公开(公告)日:2019-09-10
申请号:CN201910362646.7
申请日:2019-04-30
Applicant: 山东省计算中心(国家超级计算济南中心)
Abstract: 本发明公开了一种软件更新系统及方法,终端设备存储当前软件白名单,当前软件白名单中包括当前已安装的软件信息;服务器存储预设软件白名单,和对应的安装包,预设软件白名单中包括已登记终端设备标识信息,以及各终端设备可运行的软件信息;终端设备向服务器发送软件更新请求,所述软件更新请求包括该终端设备的标识信息以及该终端设备的当前软件白名单;服务器根据预设软件白名单判断所述终端设备是否合法,根据所述终端设备相应的预设软件白名单和接收到的当前软件白名单判断是否需要更新,需要更新时将相应安装包发送至所述终端设备。本发明采用白名单的形式对进行软件更新的终端设备和待更新的软件进行管控,保障了终端设备的安全运行。
-
公开(公告)号:CN109448739B
公开(公告)日:2019-08-23
申请号:CN201811524849.3
申请日:2018-12-13
Applicant: 山东省计算中心(国家超级计算济南中心)
IPC: G10L19/00 , G10L19/02 , G10L19/032
Abstract: 本发明公开了一种基于分层聚类的声码器线谱频率参数量化方法,包括:接收语音信号并按帧提取线谱频率参数和清浊音参数;将连续若干帧的线谱频率参数和清浊音参数分别联合,组成超帧线谱频率矢量和超帧清浊音矢量;对当前超帧清浊音矢量进行矢量量化,得到量化索引,其中,当前超帧和上一超帧对应的量化索引联合组成当前转移模式;分别计算该转移模式下的线谱频率参数的直流分量,并训练预测系数,得到该转移模式下当前超帧余量线谱频率参数;根据当前转移模式选择对应量化码本,对余量线谱频率参数进行多级矢量量化,得到量化后的余量线谱频率参数。该方法考虑了线谱频率参数在不同状态下的统计特性差异,能够提高线谱频率参数的量化质量。
-
公开(公告)号:CN104637485B
公开(公告)日:2018-05-01
申请号:CN201510094030.8
申请日:2015-03-03
Applicant: 山东省计算中心(国家超级计算济南中心)
IPC: G10L19/018
CPC classification number: G10K11/175 , G10L19/018
Abstract: 本发明的用于保护汉语语音私密度的掩蔽信号的生成方包括a).统计语句概率表;b).统计句段概率表;c).统计词组概率表;d).统计汉字概率表;e).统计音节概率表;f).按照确定自然段的语句数、语句中的句段数、句段中的词组数、词组中的汉字数、汉字的音节生成文本信息;g).语音合成。本发明的掩蔽信号的生成方法,充分考虑了会议室声音掩蔽的需求及汉语语音的特点,摒弃了采用稳态噪声等掩蔽信号的传统方式,基于汉语语言中字、词、句的各项统计特性,利用人类发声语音库,生成一种无实际意义的、与正常说话语音极其相似的掩蔽信号。这种掩蔽信号相比传统的掩蔽噪声,大大减弱了听觉上的各种负面影响,提高了声音掩蔽效果。
-
公开(公告)号:CN115171710B
公开(公告)日:2024-10-29
申请号:CN202210799728.X
申请日:2022-07-08
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学(山东省科学院)
IPC: G10L21/007 , G10L21/0224 , G10L21/0232 , G10L19/02 , G10L25/63 , G06N3/045 , G06N3/0464 , G06N3/094 , G06N3/0475 , G06N3/084 , G10L25/30
Abstract: 本发明属于语音信号处理的语音增强技术领域,提供了一种基于多角度判别的生成对抗网络的语音增强方法及系统。该方法包括,获取带噪声语音信号;基于带噪声语音信号,采用训练好的生成对抗网络,得到增强后的语音信号;其中,所述生成对抗网络包括一个生成器和四个判别器。本发明的多角度判别包括:增强后语音信号、干净语音与情绪语音之间的差异;同时添加从频域判别学习增强后语音信号、干净语音与情绪语音之间的频域差异。本发明从不同语音信号的语音成分进行判别,以及语音的时域频域角度,能够从不同角度充分学习语音成分,为生成器提供足够多的反馈信息,可以有效改善语音失真,提高增强后语音的语音质量。
-
公开(公告)号:CN113921041B
公开(公告)日:2024-10-29
申请号:CN202111183247.8
申请日:2021-10-11
Applicant: 山东省计算中心(国家超级计算济南中心)
IPC: G10L25/51 , G10L25/30 , G10L25/18 , G06F18/213 , G06F18/2415 , G06N3/0464 , G06N3/08
Abstract: 本发明提出了基于分组卷积注意力网络的录音设备识别方法及系统,包括:利用第一分组卷积注意力网络对待测音频的非话语段进行检测,完成非话语段检测后,将待测音频的非话语段筛选出来,拼接为一个完整的非话语段音频;在非话语段中提取用来作为待测录音设备的固有轨迹的随机谱特性特征,基于上述特征,利用第二分组卷积注意力网络进行录音设备识别。基于分组卷积注意力网络分别用于非话语段检测与录音设备识别,在降低整个录音设备识别模型复杂度的同时保证其高效性。
-
公开(公告)号:CN115019833B
公开(公告)日:2024-09-17
申请号:CN202210852485.1
申请日:2022-07-20
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学
Abstract: 本发明提供一种基于时频特征和全局注意力的语音情感识别方法及系统,涉及语音信号处理与模式识别技术领域,该方法通过提取三维对数梅尔谱图的时间特征和频率特征,并进行分析处理,以充分利用语音信号的静态特征和动态特征,以及静态特征和动态特征之间的通道联系,得到更深层次的特征联系,丰富了特征维度;并且,提取时间维度和空间(频率)维度数据,将其进行融合;利用空间特征提取模块和全局上下文注意力模块对时间‑频率特征进行分析,充分利用语音信号所包含的空间特征和时间特征,并对融合后的特征进行通道间的特征进行分析,其分析的特征更为全面,从而可以提高情感识别结果的准确率。
-
公开(公告)号:CN116884433A
公开(公告)日:2023-10-13
申请号:CN202310806300.8
申请日:2023-07-03
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学(山东省科学院)
Abstract: 本发明提供了一种基于图注意力的伪造语音检测方法及系统,通过预加重及自监督预训练模型和单分类学习,弥补了假语音层出不穷、训练数据不足的缺陷;在提取高级特征表示时,对通道分配注意力,捕获了更加丰富的通道信息;在使用图计算进行图建模时关注到信息量更丰富的频域子带和时域段;在多级协同异构图注意力融合机制中,充分考虑时域和频域信息的影响和交互,实现了更高效率、更强泛化性能和更准确识别率的伪造语音检测。
-
-
-
-
-
-
-
-
-