一种基于长短期记忆网络的语音端点检测方法及系统

    公开(公告)号:CN112967739B

    公开(公告)日:2022-09-06

    申请号:CN202110217938.9

    申请日:2021-02-26

    Abstract: 本公开提出了一种基于长短期记忆网络的语音端点检测方法及系统,包括:从语音数据中针对每一语音帧提取多分辨率耳蜗图特征,在一定范围内选取其数个上下文帧,将这些上下文帧按照时间顺序生成输入数据;将输入数据输入到训练后的注意力增强型长短期记忆网络中,生成局部增强的上下文帧语境信息;将局部增强后的数据输入到多头注意力层,生成全面增加权重的上下文帧信息;将全面增加权重的数据输入到神经网络(分类器)中,进行语音端点检测并生成预测结果。在编码器中使用一个注意力增强型LSTM网络,不但解决了多头注意力的位置模糊问题,同时利用数个历史时刻的状态信息,增强记忆的长、短期效果,比单一的LSTM更能突出重要的某几帧的效果。

    基于生成对抗网络的语音增强方法及系统

    公开(公告)号:CN114664318A

    公开(公告)日:2022-06-24

    申请号:CN202210301250.3

    申请日:2022-03-25

    Abstract: 本发明公开了基于生成对抗网络的语音增强方法及系统,包括:获取带噪声语音信号;将带噪声语音信号,输入到训练后的生成对抗网络中,输出增强后的语音信号;其中,所述生成对抗网络,包括两个生成器和两个判别器;所述生成对抗网络,训练过程中通过对两个生成器与两个判别器的相互博弈,提升生成器逼近目标信号的能力。本发明充分考虑了语音信号的时序关系,改进了先前的生成器与判别器的全卷积的设计,生成器中添加使用多头注意力机制,并将多生成器多阶段增强与注意力机制相结合,充分利用了多头注意力机制与生成对抗网络博弈思想。本方法能够是增强后的语音具有更高的质量与可懂度。

    一种基于频谱映射的主动降噪方法及系统

    公开(公告)号:CN114627847A

    公开(公告)日:2022-06-14

    申请号:CN202210231973.0

    申请日:2022-03-09

    Abstract: 本发明属于主动降噪技术领域,提供了一种基于频谱映射的主动降噪方法及系统,基于频谱映射,将噪声信号或者到噪声的语音信号输入LSTM网络对噪声信号或者带噪声语音信号中的噪声信号的频谱进行映射输出,根据相消干涉原理对噪声进行抵消,达到在误差麦克风处降低噪声声压级的目的,最后将误差信号用于计算损失函数并反馈给LSTM网络,直至网络损失函数最小并达到收敛状态,此方法将深度学习的知识用于主动降噪领域,不但提高了降噪效果,并且降低了传统信号处理方法对硬件设备的依赖问题。

    一种基于长短期记忆网络的语音端点检测方法及系统

    公开(公告)号:CN112967739A

    公开(公告)日:2021-06-15

    申请号:CN202110217938.9

    申请日:2021-02-26

    Abstract: 本公开提出了一种基于长短期记忆网络的语音端点检测方法及系统,包括:从语音数据中针对每一语音帧提取多分辨率耳蜗图特征,在一定范围内选取其数个上下文帧,将这些上下文帧按照时间顺序生成输入数据;将输入数据输入到训练后的注意力增强型长短期记忆网络中,生成局部增强的上下文帧语境信息;将局部增强后的数据输入到多头注意力层,生成全面增加权重的上下文帧信息;将全面增加权重的数据输入到神经网络(分类器)中,进行语音端点检测并生成预测结果。在编码器中使用一个注意力增强型LSTM网络,不但解决了多头注意力的位置模糊问题,同时利用数个历史时刻的状态信息,增强记忆的长、短期效果,比单一的LSTM更能突出重要的某几帧的效果。

    基于图神经网络的政策文本多标签标注方法及系统

    公开(公告)号:CN112906382A

    公开(公告)日:2021-06-04

    申请号:CN202110160984.X

    申请日:2021-02-05

    Abstract: 本发明公开了基于图神经网络的政策文本多标签标注方法及系统,包括:获取待标注的政策文本;对待标注的政策文本进行预处理,对预处理后的政策文本进行分词;将分词得到的单词和预先得到的加权单词向量,输入到训练后的全连接神经网络中,输出待标注政策文本的多标签。高效的标签标注过程,利用廉价的计算资源,减少大量人工成本。相较于人工,实现更加精准的标签标注,不会因为文件信息量的长短而产生标签标注的错漏。及时性的政策文件多标签标注,快速进行所需政策文件的标签标注。减少了主观差异性,不会因为不同的工人的主观判断不同而造成大量的标注标签的差异性。

    一种多声掩蔽系统信息中心化管理系统及方法

    公开(公告)号:CN111508461A

    公开(公告)日:2020-08-07

    申请号:CN202010284793.X

    申请日:2020-04-13

    Abstract: 本发明公开了一种多声掩蔽系统信息中心化管理系统及方法,包括:控制器、信息中心化管理设备以及分别与所述信息中心化管理设备连接的至少两个声掩蔽系统,每一个声掩蔽系统包括声掩蔽系统控制器以及与其连接的至少一个声掩蔽系统负载;所述信息中心化管理设备被配置为对各声掩蔽系统进行参数配置;并且,接收各声掩蔽系统上传的工作状态数据,对所述工作状态数据进行分类,按照各数据分类的优先级别发送至控制器。本发明可根据防护区域的大小进行灵活扩展,实现多声掩蔽系统的协同防护;可以方便获取需防护区域防护参数,并进行灵活配置声掩蔽系统的数量以及位置。

    声掩蔽系统多负载条件下负载工作状态实时监测装置

    公开(公告)号:CN110568290A

    公开(公告)日:2019-12-13

    申请号:CN201910879457.7

    申请日:2019-09-18

    Abstract: 本发明涉及声掩蔽系统技术领域,公开了声掩蔽系统多负载条件下负载工作状态实时监测装置,解决了多负载条件下负载工作状态实时监测的技术问题。通过采样模块连接有输出接口、输入接口和监测模块,所述监测模块连接有通信接口,电源模块包括电源管理模块、锂电池供电接口、适配器供电接口、参考采样电源接口,利用分压原理,结合声掩蔽系统输出信号的特性,在不影响声掩蔽系统输出信号的前提条件下,方便的实现音频发生器、振动发生器等负载器件工作状态的实时在线监测。该实时在线监测装置可以监测负载的短路、断路等异常情况,并且具有结构简单、成本低、灵敏度高、误报率低等特点。

Patent Agency Ranking