-
公开(公告)号:CN105405445B
公开(公告)日:2019-03-22
申请号:CN201510915572.7
申请日:2015-12-10
Applicant: 北京大学
IPC: G10L19/008 , G10L19/04
Abstract: 本发明公开了一种基于声道间传递函数的参数立体声编码、解码方法。本发明编码方法为:1)编码端利用左右声道信号生成下混信号;2)将输入的下混信号和一单声道信号分别分帧后,提取每一帧的声道间传递函数系数;然后将提取的传递函数系数拼成一二维矩阵;其中,所述单声道信号为左声道信号或右声道信号;3)对该二维矩阵依次进行二维压缩、游程编码、熵编码,将该二维矩阵中的系数压缩生成边信息,然后与下混信号形成比特流。本发明保留了信号的低高频空间信息,同时实现了帧内和帧间的压缩。
-
公开(公告)号:CN109327785A
公开(公告)日:2019-02-12
申请号:CN201811172486.1
申请日:2018-10-09
Applicant: 北京大学
Abstract: 本发明公开了一种基于言语测听的助听增益适配方法及设备。本方法为:1)获取并量化待测者的响度感知能力;2)计算测试材料的易混淆词对在选定的听力正常人上引起的特性响度模式,选出识别正确率能反映区分性感知线索的词对;3)使用筛选出的词对对听者进行言语测听;对言语测听结果进行估计,得到听者在不同频带、声强下的斜率;4)根据斜率计算出各频带在若干个设定声强范围内的助听增益的压缩率,更新对应声强范围的助听增益;5)根据斜率和压缩率从测试材料中选取下一轮言语测听的测听词对;6)重复步骤3)~5),直到满足设定的终止条件;然后选择最后若干轮迭代的助听增益的均值作为该待测者最终的助听增益适配结果。
-
公开(公告)号:CN108596016A
公开(公告)日:2018-09-28
申请号:CN201810182617.8
申请日:2018-03-06
Applicant: 北京大学
Abstract: 本发明公开了一种基于深度神经网络的个性化头相关传输函数建模方法。本方法是基于空间主成分分析对HRTF数据进行分解,将分解得到空间主成分、空间主成分系数和平均空间函数分别用神经网络建模,其中,空间主成分和平均空间函数只与空间方向有关,空间主成分系数是频率和被试个性化特征参数的函数;本发明用深层神经网络对空间主成分,平均空间函数和双耳时间差分别建模,将水平角及仰角等空间方向信息引入网络输入层;同时,用神经网络基于人体测量参数对空间主成分系数建模。基于上述模型,可根据被试少量的人体测量参数,得到其在空间任意方向个性化的HRTF。
-
公开(公告)号:CN108318862A
公开(公告)日:2018-07-24
申请号:CN201711428934.5
申请日:2017-12-26
Applicant: 北京大学
IPC: G01S5/22
CPC classification number: G01S5/22
Abstract: 本发明公开了一种基于神经网络的声源定位方法。本发明对所有传输路径的传递函数,即传递特性进行建模,通过深度学习的方式从大量数据中学习到声音信号在传播过程中由于散射体的存在或环境等原因造成的相位和幅度变化规律,通过神经网络可以恢复到原始的相位和幅度,最后结合时间差和幅度差两个定位线索进行声源定位。本发明利用了已知的时延信息,再利用深度神经网络恢复原始的相位和幅度,并有效地结合了时间信息和幅度信息进行定位,显著提高了抗噪性能。
-
公开(公告)号:CN105072557B
公开(公告)日:2017-04-19
申请号:CN201510490058.3
申请日:2015-08-11
Applicant: 北京大学
Abstract: 本发明公开了一种三维环绕声重放系统的扬声器环境自适应校准方法。本方法为:1)测量三维环绕声重放系统的听音环境内每一通道扬声器到听音位置的传递函数hi(n);2)计算每一传递函数hi(n)的逆函数gi(n);3)测量激励信号源的虚拟方位(θ,δ)以及各通道扬声器的摆放位置(θi,δi),依据三维环绕声算法计算各通道扬声器的理想输出信号ti;4)将各通道扬声器的理想输出信号ti与相应通道的逆函数gi(n)进行卷积计算,得到各通道扬声器的实际输出信号t'i,其中,i=1…M,M为扬声器总数,n代表时间。此方法可均衡由扬声器性能、非球面均匀分布、传输信道的不一致性。
-
公开(公告)号:CN106373583A
公开(公告)日:2017-02-01
申请号:CN201610861273.4
申请日:2016-09-28
Applicant: 北京大学
IPC: G10L19/008
CPC classification number: G10L19/008
Abstract: 本发明公开了一种基于理想软阈值掩模IRM的多音频对象编、解码方法。本编码方法为:1)编码端对输入的各音频对象时间信息的元数据以及音频对象信息进行预处理模,形成通道形式的各音频对象;2)编码端将各通道形式的音频对象生成一个下混信号,然后根据该下混信号和第i个通道形式的音频对象进行软阈值掩模提取,生成第i个通道形式的音频对象的掩模MASKi;3)编码端针对所有音频对象的掩模MASK进行压缩,生成掩模码流;编码端将该下混信号经过编码压缩得到的编码结果、所述元数据和各所述掩模码流进行合成,得到合成码流输出。本发明充分利用了音频自身稀疏性的特点,压缩更有针对性并且更加有效。
-
公开(公告)号:CN105447244A
公开(公告)日:2016-03-30
申请号:CN201510795213.2
申请日:2015-11-18
Applicant: 北京大学
IPC: G06F17/50
CPC classification number: G06F17/5009
Abstract: 本发明公开了一种3D录音系统球面麦克风阵列分布方法。本方法为:1)对球形3D录音系统进行建模,得到一单位球体;然后将待分布的N个麦克风作为带电粒子,随机分布在该单位球体表面;2)计算每个带电粒子在各个方向上受到的合力大小,然后计算出合力在对应带电粒子上的切线分量;3)根据切线矢量计算对应带电粒子沿切向运动飞出该单位球体表面的坐标,然后对每一带电粒子的坐标沿径向进行归一化,使所有带电粒子再次回到该单位球体的表面;4)步骤2)、3)循环若干次,当各带电粒子所受合力均小于一设定值时,得到各带电粒子的球面均匀分布,即N个麦克风在该球形3D录音系统的阵列分布。本发明具有确定分布效率高、采样效果好等优点。
-
公开(公告)号:CN103458261B
公开(公告)日:2015-04-08
申请号:CN201310405312.6
申请日:2013-09-08
Applicant: 华东电网有限公司 , 北京大学 , 上海艾飞能源科技有限公司
Abstract: 本发明公开了一种基于立体视觉的视频场景变化检测方法,包括以下步骤:(a)在当前时刻,利用变分法通过聚焦分别恢复双目相机所获取的左眼图像和右眼图像中的场景深度信息;(b)利用双目立体匹配方法获得当前场景深度,并利用(a)得到的场景深度信息对双目立体匹配方法无法获取深度的区域进行插值;(c)将(b)得到的当前场景深度与前一时刻获得的场景深度进行比较,得到对应的场景变化。本发明计算过程收敛快速、并可减少立体视觉致密匹配方法在重复纹理区域和遮挡区域容易产生的错误。
-
公开(公告)号:CN103700372A
公开(公告)日:2014-04-02
申请号:CN201310745761.5
申请日:2013-12-30
Applicant: 北京大学
IPC: G10L19/008
Abstract: 本发明公开了一种基于正交解相关技术的参数立体声编码、解码方法。本编码方法:1)将输入的左声道、右声道时域信号分别变换到复频域,得到两复频域信号L和R;2)对L和R输出为一个下混信号M;3)利用L和R估算出边信息,并对所述边信息进行融合量化;所述边信息包括声道内互相关系数ICC、声道间强度差IID和旋转方位信息RD;4)对M时域反变换并编码输出;将边信息压缩编码输出。解码方法:将输入的时域下混信号变换到复频域输出信号M;对输入的边信息进行解码;根据RD求解一与M幅值相等且正交的输出信号D;根据ICC、IID计算旋转矩阵H;利用H、M及D得到复频域信号L和R变化到时域输出。本发明大大提高了解码速度。
-
公开(公告)号:CN101510221B
公开(公告)日:2012-05-30
申请号:CN200910131826.0
申请日:2009-04-08
Applicant: 北京大学
Abstract: 本发明公开了一种基于自然语言理解的查询语句分析方法与系统,属于信息检索技术领域。本发明的方法为:1)对输入的中文查询语句进行自动分词、命名实体识别和词性标注;2)对分词后的句子进行句法结构分析,得到句法结构树;根据词性标注后的句子确定每个词的词义;3)根据句子的句法结构和每个词的词义,对句子中谓词进行语义角色标注;4)根据上述对句子在词法、句法和语义层上的分析结果扩充关键词,提取能反映用户信息检索需求的关键词。本发明的系统包括词法分析模块、句法分析模块、语义分析模块和关键词提取模块。本发明可以大大提高查询结果的准确率,使用户得到想要的查询结果。
-
-
-
-
-
-
-
-
-