-
公开(公告)号:CN117542367A
公开(公告)日:2024-02-09
申请号:CN202311517593.4
申请日:2023-11-15
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G10L21/0208 , G10L21/0216
Abstract: 本发明涉及降噪方法,尤其涉及一种轻量化多轴Transformer的单通道降噪方法。可以充分提取语音信号潜在的时频特征。采用多头动态局部自关注模块高效提取局部特征。本文提出的方法具有更少的网络参数和更低的计算成本,同时与最先进的方法相比,在语音信号的质量和可懂度方面具有竞争力。可以充分提取语音信号潜在的时频特征,能够有效降低计算机的资源消耗。提示块以使得模型更好学得频率特征信息。
-
公开(公告)号:CN117542342A
公开(公告)日:2024-02-09
申请号:CN202311517595.3
申请日:2023-11-15
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G10K11/178 , G10L21/0216 , G10L21/0208
Abstract: 本发明涉及声音处理技术领域,尤其涉及一种基于自适应滤波与神经网络的回声消除方法。该模型由两部分组成:用于消除线性回声的Speex算法,以及进一步消除回声的多尺度时频UNet。主要优点如下:(1)在自适应滤波之前进行了时间对齐,弥补了回声信号的延迟,提升了自适应滤波器的回声消除效果;(2)以UNet为基础,构建了一个能多尺度地提取时频维度特征的神经网络;(3)该多级回声消除模型可以在复杂的噪声、混响环境下实现优越的回声消除效果。
-
公开(公告)号:CN117496926A
公开(公告)日:2024-02-02
申请号:CN202311511710.6
申请日:2023-11-14
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明涉及语言处理技术领域,尤其涉及一种基于大型预训练语言模型的音乐生成方法。通过使用数千个旋律MIDI文件对GPT‑3进行微调,然后使用微调后的模型来进行旋律生成。该方法的主要优点如下:(1)算法可以学习旋律的长期依赖结构,并生成富有长期结构和音乐性的音乐;(2)算法可以通过调整微调数据格式,模拟不同的旋律生成方法;(3)算法允许仅使用较少的数据,可以生成类似风格的旋律。
-
公开(公告)号:CN109859767B
公开(公告)日:2020-10-13
申请号:CN201910168122.4
申请日:2019-03-06
Applicant: 哈尔滨工业大学(深圳)
IPC: G10L21/0208 , G10L21/0216 , G10L25/24 , G10L25/30 , H04R25/00
Abstract: 本发明提供了一种用于数字助听器的环境自适应神经网络降噪方法,包括依次执行如下步骤:预处理步骤:接收带噪语音信号,带噪语音信号经过采样分帧后传输至声学场景识别模块;场景识别步骤:采用声学场景识别模块对所处的声学场景进行识别,然后由声学场景识别模块自主的选择神经网络降噪模块中不同的神经网络模型进行发送;神经网络降噪步骤。本发明的有益效果是:1.可以保证语音处理的实时性,只进行神经网络的前向传播,运算量不高;2.可以对所处的声学场景进行识别,然后自主地选择不同的神经网络模型,对不同的场景下的噪声进行针对性地降噪处理,能保证更好的语音质量和语音可懂度;3.可以有效地抑制瞬时噪声。
-
公开(公告)号:CN109817234A
公开(公告)日:2019-05-28
申请号:CN201910168105.0
申请日:2019-03-06
Applicant: 哈尔滨工业大学(深圳)
IPC: G10L21/02 , G10L21/0272 , G10L25/03 , G10L25/45
Abstract: 本发明提供了一种基于连续噪声跟踪的目标语音信号增强方法、系统及存储介质,该目标语音信号增强方法包括:步骤1:接收带噪语音信号,对带噪语音信号进行分帧加窗处理,使用短时傅里叶变换得到时频域的关系;步骤2:对噪声功率谱进行估计;步骤3:语音功率谱的估计;步骤4:通过语音估计器对语音信号进行估计;步骤5:反傅里叶变换,加窗并使用交叠相加技术实现语音恢复。本发明的有益效果是:本发明有效地把目标语音信号分离出来,大大减小了语音信号中的噪声残余量,使得目标信号的质量大大提高。这对自动语音识别、说话人识别、人机对话接口以及助听器等应用有着非常重要的作用。
-
公开(公告)号:CN109740544A
公开(公告)日:2019-05-10
申请号:CN201910013388.1
申请日:2019-01-07
Applicant: 哈尔滨工业大学(深圳)
Abstract: 本发明公开了一种基于脑电信号的听觉注意状态觉醒度识别方法、装置及存储介质,包括:采集得到所需要的脑电信号;基于获取的脑电信号,以及训练过程构建的第一级主成分滤波器,进行第一级基于集合经验模态分解和主成分滤波的特征抽取;基于第一级特征提取信号,以及训练过程构建的第二级主成分滤波器,进行第二级基于集合经验模态分解和主成分滤波的特征抽取;基于第二级特征提取信号,对抽取特征信号进行基于方差统计量的特征向量计算;基于特征向量计算结果以及训练过程构建的机器学习分类器,提取测试过程中基于脑电信号的听觉注意状态觉醒度。本发明实现了听觉注意状态的觉醒度识别,有助于提高听觉注意状态觉醒度识别精度和识别有效性。
-
公开(公告)号:CN104703107B
公开(公告)日:2018-06-08
申请号:CN201510066773.4
申请日:2015-02-06
Applicant: 哈尔滨工业大学深圳研究生院
IPC: H04R25/00
Abstract: 本发明提出了一种适用于数字助听器中的自适应回波抵消方法NBLMS_M‑K,在以M为一个周期内,每来一个信号点对前K个滤波器抽头系数进行更新,在第M个信号点进入系统时,对全部的滤波器系数进行更新。该方法既降低了算法的复杂度,又保证处理后的语音具有较高的可懂度和清晰度,满足了数字助听器体积小、功耗低的要求。
-
公开(公告)号:CN104064179B
公开(公告)日:2018-06-08
申请号:CN201410281284.6
申请日:2014-06-20
Applicant: 哈尔滨工业大学深圳研究生院
Abstract: 本发明为大规模孤立词语音识别提供了一种提高识别准确率的方法,针对不同的孤立词建立了隐马尔科夫模型(HMM)参数自适应变化的机制,解决了不同的孤立词因HMM概率模型中事件数相同而识别准确率和识别鲁棒性低的问题。实验结果表明,本发明的方法在稍许增加识别计算量的前提下,有效地提高了大规模孤立词语音识别的准确率。待识别孤立词为5120词时,多次识别准确率的平均值由91%提高到了97.3%;待识别孤立词为10240词时,多次识别准确率的平均值由87%提高到了96.3%。相比于传统的基于统计概率的静态模型的语音识别,采用本发明方法的优势在于针对不同用户自适应的调整识别模型的参数,从而提高识别的准确率。
-
公开(公告)号:CN105411037A8
公开(公告)日:2016-09-07
申请号:CN201510908758.X
申请日:2015-12-10
Applicant: 哈尔滨工业大学深圳研究生院 , 北京大学深圳研究生院 , 深圳集成电路设计产业化基地管理中心
IPC: A41D13/018
Abstract: 本发明提出了一种防摔保护系统,利用足底压力和姿态传感器共同预判摔倒状态及摔倒方向,在确认使用者处于摔倒的过程中后,快速对相应的气囊进行充气。充气气囊被划分为主充气管道、辅充气管道、气囊其余部分,优先保证主充气管道的气压和充气速度,实现主要的受力支撑,为提高充气速度,实现多个高压小气瓶对同一个气囊进行充气,充气过程的启动使用电磁充气阀控制。在充气的先后顺序上,不是对整个空间进行统一的充气,而是在气囊中划分不同级别的充气通道,先对重要通道空间进行充气,再对次要通道空间进行充气,最后对气囊的其余部分充气,这样就做到了先对重点部位进行保护,再对其他部位进行保护,减小充气速度不够时可能产生的不良效果。
-
公开(公告)号:CN105534526A8
公开(公告)日:2016-08-17
申请号:CN201510946361.X
申请日:2015-12-16
Applicant: 哈尔滨工业大学深圳研究生院 , 北京大学深圳研究生院 , 深圳集成电路设计产业化基地管理中心
IPC: A61B5/103
Abstract: 本发明公开了一种测量足底压力的方法,该方法的主要目的是减少足底压力信息准确监测的成本。本发明首先利用较多传感点的足底压力测量设备测量足底压力信息,再根据该信息和本发明提出的建模方法以及足底压力的模型进行建模,该模型可以体现不同人之间的差异化,最后使用较小传感点的足底压力测量设备,监测测量者的足底压力信息,再通过模型反推还原得到足底各位置点上的足底压力信息,从而实现了使用简易设备得到较为完整精确的足底压力信息的方法。其中优化的多点的测量设备使用不同间距的传感阵列布局,优化的少点的测量设备使用传感器单元可插嵌的结构实现。足底压力模型使用了两种模型,一种为神经网络模型,另一种为距离相关的插值模型。
-
-
-
-
-
-
-
-
-