一种基于脑电的想象语音解码方法

    公开(公告)号:CN118135986A

    公开(公告)日:2024-06-04

    申请号:CN202410168444.X

    申请日:2024-02-06

    Abstract: 本发明公开了一种基于脑电的想象语音解码方法。本发明在受试者先进行发声语音然后进行想象语音的实验范式下,分别采集受试者的语音信号和脑电信号。首先使用迭代式的自监督语音反演模型提取语音对应的发声轨迹参数,然后构建脑电‑轨迹解码模型并使用多任务学习的方式训练模型。在使用阶段,以脑电信号为输入,输出预测的发声轨迹参数,随后使用声道实验室VTL作为发音式语音合成模型从预测的发声轨迹参数中合成语音。结果显示,本发明提出的想象语音解码方法可以从受试者的脑电中有效地合成语音,客观指标和主观指标上都优于现有方法。

    基于双向级联框架的迭代式基频估计与语音分离方法和装置

    公开(公告)号:CN115862659A

    公开(公告)日:2023-03-28

    申请号:CN202211184250.6

    申请日:2022-09-27

    Applicant: 北京大学

    Abstract: 本发明公开了一种基于双向级联框架的迭代式基频提取与语音分离方法和装置,对混合语音逐帧迭代地进行“基频预测‑语音分离‑基频更新”,在迭代中提升二者的性能。基频预测模块为后续模块提供基频线索,解决了多个输出带来的置换问题和说话人数目不确定的问题。语音分离模块利用有条件的生成对抗网络进行生成式语音分离,提升分离的语音质量。基频更新模块从已分离出的干净语音中,重新提取基频,更新基频预测的预测值,实现了“预测‑分离‑更新”过程的闭环。在本发明提出的双向级联框架下,语音分离与基频提取这两个任务以迭代的方法交替更新,互相依赖、互相促进,两个任务都取得了更好的性能。

    一种基于言语测听的助听增益适配方法及设备

    公开(公告)号:CN109327785B

    公开(公告)日:2020-10-20

    申请号:CN201811172486.1

    申请日:2018-10-09

    Applicant: 北京大学

    Abstract: 本发明公开了一种基于言语测听的助听增益适配方法及设备。本方法为:1)获取并量化待测者的响度感知能力;2)计算测试材料的易混淆词对在选定的听力正常人上引起的特性响度模式,选出识别正确率能反映区分性感知线索的词对;3)使用筛选出的词对对听者进行言语测听;对言语测听结果进行估计,得到听者在不同频带、声强下的斜率;4)根据斜率计算出各频带在若干个设定声强范围内的助听增益的压缩率,更新对应声强范围的助听增益;5)根据斜率和压缩率从测试材料中选取下一轮言语测听的测听词对;6)重复步骤3)~5),直到满足设定的终止条件;然后选择最后若干轮迭代的助听增益的均值作为该待测者最终的助听增益适配结果。

    数字助听器语音频率压缩方法

    公开(公告)号:CN1870133A

    公开(公告)日:2006-11-29

    申请号:CN200510011780.0

    申请日:2005-05-24

    Abstract: 本发明中提出一种数字助听器语音频率压缩方法,通过对信号的短时频谱系数进行处理,将宽带语音信号压缩为窄带语音信号。根据本发明的方法包括以下技术:1)利用加窗傅氏变换进行时频域的转换;2)通过信号对数谱的斜率来判断语音信号的能量分布,并动态地调整语音频谱;3)通过去除高频谱系数的方法,实现低通滤波;4)通过频谱包络调整的方法,压缩语音频带。本发明只通过调整信号频谱包络来压缩信号带宽,这种方法相当于对信号进行线性处理,避免了非线性频移方法给语音信号带来的听觉失真,而动态的频谱调整又能尽量地保证语音的低频段信息不受破坏,因此利用该方案能够产生高质量的清晰语音。

    一种针对听觉系统频率选择性损伤的听力补偿方法

    公开(公告)号:CN116582807A

    公开(公告)日:2023-08-11

    申请号:CN202310397202.3

    申请日:2023-04-14

    Applicant: 北京大学

    Abstract: 本发明公开了一种针对听觉系统频率选择性损伤的听力补偿方法,其步骤包括:1)使用全连接神经网络构建补偿模块,对训练集中的每一样本声音信号进行非线性变化,得到针对目标听力损伤程度人群补偿后的声音信号;2)对模拟听力损伤模型进行设置,作为该目标听力损伤程度人群的模拟听觉系统,对每一所述补偿后的声音信号进行非线性处理,生成非线性失真信号;3)将样本声音信号对应的补偿后的声音信号作为该样本声音信号对应的非线性失真信号的标签,生成一配对数据;4)利用生成的各所述配对数据训练所述神经网络;5)对于给定的一段声音信号,利用步骤4)训练后的神经网络进行处理,生成针对该目标听力损伤程度人群的补偿后的声音信号。

    一种基于言语可懂度指数的听力评估方法及设备

    公开(公告)号:CN112205981A

    公开(公告)日:2021-01-12

    申请号:CN202011077820.2

    申请日:2020-10-10

    Applicant: 北京大学

    Abstract: 本发明公开了一种基于言语可懂度指数的听力评估方法及设备,其步骤包括:1)利用言语可懂度指数建立听阈与言语识别表现的函数关系;2)根据选定的易混淆元音对、辅音对构建易混淆双音节词对语料作为言语测听的测试语料,利用快速频带权重测量方法测量该测试语料的频带权重函数BIF;3)使用步骤2)中构建的易混淆双音节词对对被试者进行言语测听;然后选择使得易混淆双音节词对测试结果似然值最大的声强条件作为该被试者的最终听阈。本发明在非专业环境下也能得到较为稳定可靠的结果,与纯音测听的结果相关性较大,因此是解决移动终端听力评估的一种可行方案。

    一种基于言语测听的助听增益适配方法及设备

    公开(公告)号:CN109327785A

    公开(公告)日:2019-02-12

    申请号:CN201811172486.1

    申请日:2018-10-09

    Applicant: 北京大学

    Abstract: 本发明公开了一种基于言语测听的助听增益适配方法及设备。本方法为:1)获取并量化待测者的响度感知能力;2)计算测试材料的易混淆词对在选定的听力正常人上引起的特性响度模式,选出识别正确率能反映区分性感知线索的词对;3)使用筛选出的词对对听者进行言语测听;对言语测听结果进行估计,得到听者在不同频带、声强下的斜率;4)根据斜率计算出各频带在若干个设定声强范围内的助听增益的压缩率,更新对应声强范围的助听增益;5)根据斜率和压缩率从测试材料中选取下一轮言语测听的测听词对;6)重复步骤3)~5),直到满足设定的终止条件;然后选择最后若干轮迭代的助听增益的均值作为该待测者最终的助听增益适配结果。

    数字助听器语音频率压缩方法

    公开(公告)号:CN100440317C

    公开(公告)日:2008-12-03

    申请号:CN200510011780.0

    申请日:2005-05-24

    Abstract: 本发明中提出一种数字助听器语音频率压缩方法,通过对信号的短时频谱系数进行处理,将宽带语音信号压缩为窄带语音信号。根据本发明的方法包括以下技术:1)利用加窗傅氏变换进行时频域的转换;2)通过信号对数谱的斜率来判断语音信号的能量分布,并动态地调整语音频谱;3)通过去除高频谱系数的方法,实现低通滤波;4)通过频谱包络调整的方法,压缩语音频带。本发明只通过调整信号频谱包络来压缩信号带宽,这种方法相当于对信号进行线性处理,避免了非线性频移方法给语音信号带来的听觉失真,而动态的频谱调整又能尽量地保证语音的低频段信息不受破坏,因此利用该方案能够产生高质量的清晰语音。

Patent Agency Ranking