适合汉语语音编码策略的人工耳蜗方法

    公开(公告)号:CN1868427A

    公开(公告)日:2006-11-29

    申请号:CN200510011783.4

    申请日:2005-05-24

    Abstract: 本发明中提出一种适合汉语语音编码策略的人工耳蜗方法,包括以下几个部分:预加重,语音信号经一阶FIR高通滤波器提升信号中的高频成分;分带滤波,根据人耳听觉特性对语音频带进行等bark尺度划分,分为若干子带,并基于傅氏变换的频域滤波技术对信号进行零相位失真滤波,得到每个子带的信号;准锁相刺激发放,包括过零点检测、包络提取、非线性动态范围压缩、电脉冲发放;过零点检测检测各个频带的信号正向过零点,作为该频带的零相位时刻;包络提取,提取各个子带信号的包络,如利用Hilbert变换来求;非线性动态范围压缩对包络值的动态范围进行非线性压缩;以及电脉冲发放。

    结合语义和声纹信息的说话人身份确认系统

    公开(公告)号:CN1547191A

    公开(公告)日:2004-11-17

    申请号:CN200310118507.9

    申请日:2003-12-12

    Abstract: 本发明涉及一种语音识别系统,尤其是利用说话人声音的独特生物测定学特征来识别说话人身份的系统。我们的目的在于用语义信息确认来替代基于声纹确认的训练过程,在基于声纹确认的准备工作还没有完成之前来进行识别工作。同时语义信息确认还可以帮助声纹确认搜集所需的训练语料,等基于声纹识别的准备工作完成之后,我们可以把二者结合起来,进一步增强系统的安全性。本发明采取的技术方案是根据说话人的声纹特征通过GMM模型(高斯混合模型)建立声纹模型;通过电话等语音输入设备录入语音,对声音进行预处理;对处理后的声音根据一定的声纹模型进行声纹特征提取;同时进行文本判断;用声纹特征和文本判断来识别说话人身份。本发明包括如下几个子系统:特征提取、声学模型建模、基于语义的说话人确认VIV(语义信息确认)系统、文本有关和文本无关的声纹确认系统。各子系统在特征、统计模型的选择、目标模型和背景模型的建模以及统计确认都有其各自的特点达到本发明的目的。

    基于条件具身自监督学习的机器人手臂多解学习方法

    公开(公告)号:CN117829247A

    公开(公告)日:2024-04-05

    申请号:CN202311674898.6

    申请日:2023-12-07

    Applicant: 北京大学

    Abstract: 本发明公开了一种基于条件具身自监督学习的机器人手臂多解学习方法,该方法包括:获取机器人手臂末端的预测位置p(t),并从高斯分布#imgabs0#中采样一个隐变量z(t);将预测位置p(t)和隐变量z(t)输入到反模型,得到机器人手臂末端到达该预测位置p(t)所需的关节角度q(t);基于正模型预测出该关节角度q(t)所对应的预测位置p(t+1);将预测位置p(t+1)和隐变量z(t)输入到反模型,得到机器人手臂末端到达该预测位置p(t+1)所需的关节角度q′(t)后,将关节角度q(t)作为关节角度q′(t)的监督信息,并使用梯度下降法更新所述反模型的参数;重复上述步骤,直至关节角度q(t)与关节角度q′(t)之差小于一设定值时,得到训练好的反模型。本发明不仅使得机器人手臂的多解模型具有高精度,而且还能自主获取多解数据。

    一种基于深度学习和柱谐分解的空间主动降噪方法

    公开(公告)号:CN117133262A

    公开(公告)日:2023-11-28

    申请号:CN202310955389.4

    申请日:2023-08-01

    Applicant: 北京大学

    Abstract: 本发明公开了一种基于深度学习和柱谐分解的空间主动降噪方法,本发明通过环形麦克风阵列,采集噪声信号;经过柱谐分解,得到可以表示整个声场的柱谐信号;利用柱谐信号训练CTN神经网络,实现对柱谐信号的时序建模,即基于当前的柱谐信号预测下一个时刻的柱谐信号,从而得到反相的抵消柱谐信号;将反相的抵消柱谐信号经过逆柱谐变换得到误差麦克风处反相的抵消信号,从而得到抵消扬声器需要播放的信号;最终可以实现一定区域内的噪声的消除。本发明通过对柱谐信号的抵消实现对整个声场而不仅仅是误差麦克风信号的消除。

    一种说话人数未知的多通道语音分离方法

    公开(公告)号:CN112116920B

    公开(公告)日:2022-08-05

    申请号:CN202010796279.4

    申请日:2020-08-10

    Applicant: 北京大学

    Abstract: 本发明公开了一种说话人数未知的多通道语音分离方法。本方法步骤包括:1)采集目标空间中的多通道音频信号,并提取该多通道音频信号的时频特征和空间特征;2)利用所述时频特征和所述空间特征估计出该目标空间中说话人所在方向的数目;3)利用所述时频特征、空间特征及估计出的方向数目,获得该目标空间中各说话人所在目标方向;4)利用估计出的各说话人所在目标方向设计方向特征,并结合时频特征和空间特征从该多通道音频信号中提取出每一目标方向上的语音信号;5)从每一目标方向上的语音信号中迭代分离出对应目标方向上可能存在的多个说话人语音。本发明既规避了语音迭代分离误差随迭代次数增大而增大的问题,又提高了语音分离的性能。

    一种用于无地图导航的主动听觉定位方法

    公开(公告)号:CN114563011A

    公开(公告)日:2022-05-31

    申请号:CN202210079214.7

    申请日:2022-01-24

    Applicant: 北京大学

    Abstract: 本发明公开了一种用于无地图导航的主动听觉定位方法,其步骤包括:1)在仿真平台上通过强化学习方法训练移动机器人导航模型;2)移动机器人按照设定的时间步长,采集当前时刻激光雷达的测距信息、基于目标位置的声源获取听觉定向信息和移动机器人里程计的位姿信息;其中,激光雷达搭载在移动机器人上;3)将所述测距信息、听觉定向信息和位姿信息输入步骤1)训练后的移动机器人导航模型推理出当前时刻的速度指令,移动机器人根据所述速度指令导航到目标位置。本发明采用了更加可靠和有效的目标定位方式,对于真实场景的无地图导航来说,具有较高的应用价值。

    一种室内早期反射声定位方法及系统

    公开(公告)号:CN111123202B

    公开(公告)日:2022-01-11

    申请号:CN202010010386.X

    申请日:2020-01-06

    Applicant: 北京大学

    Abstract: 本发明公开了一种室内早期反射声定位方法及系统。本方法为:1)生成不同房间的冲激响应;2)对于每一冲激响应,将其与声源信号进行卷积计算,得到一M通道的阵列信号;3)对每一阵列信号进行短时傅里叶变换,并取J个时频点;然后计算每个时频点的连续N阶HOA系数,将M通道的阵列信号转换为N2通道的阵列信号;4)将每一N2通道的阵列信号的实部和虚部分开作为单独的通道拼接,得到一2N2通道的阵列信号;然后将连续K帧打包,形成一2N2×K×J维度的样本;5)利用样本训练神经网络;对于一目标房间中的声源,将该目标房间的冲击响应和对应的2N2×K×J维度阵列信号输入训练后的神经网络,定位出该目标房间中的声源位置。

    一种基于撞击预测和主动顺应的机器人跌倒保护方法及系统

    公开(公告)号:CN112025698B

    公开(公告)日:2021-11-23

    申请号:CN202010670711.5

    申请日:2020-07-13

    Applicant: 北京大学

    Abstract: 本发明涉及一种基于撞击预测和主动顺应的机器人跌倒保护方法及系统。该方法包括:在机器人受到推力后,应用预先训练完成的跌倒保护控制模型计算得到机器人的运动控制参数;根据机器人的运动控制参数进行撞击预测,得到预测的机器人撞击地面的时刻;根据机器人的运动控制参数和预测的机器人撞击地面的时刻,对机器人进行主动顺应,实现机器人跌倒保护。该系统包括跌倒检测模块、跌倒保护模块。本发明对机器人触地的时刻进行预测,并依据预测结果提前执行主动顺应,减小了传感器延迟带来的干扰,减小了冲击力,可用于仿人机器人的跌倒保护,为机器人在复杂环境中的研究和应用提供了帮助,减少了机器人可能受到的伤害。

Patent Agency Ranking