Patent search ap:("华南理工大学") AND inv:"钟小丽" Page 2

11.

发明授权
具定制功能的5.1通路环绕声耳机重放信号处理方法有权

公开(公告)号：CN103237287B

公开(公告)日：2015-03-11

申请号：CN201310109533.9

申请日：2013-03-29

Applicant: 华南理工大学

Inventor： 谢菠荪 , 钟小丽 , 张承云

IPC: H04S5/00 , H04R5/033

Abstract: 本发明公开了一种具定制功能的5.1通路环绕声耳机重放信号处理方法，采用头相关传输函数对输入的5.1通路环绕声信号进行滤波，将5.1通路环绕声信号转换为适合一对耳机重放的双耳信号。本发明提供七组具有代表性的头相关传输函数数据供用户选择，该方法能减少5.1通路环绕声的双耳(虚拟)耳机重放中虚拟声源头中定位、前后混乱、感知仰角错误等问题，同时使主观试听选择匹配头相关传输函数数据过程简单易行，也减少了所需要的系统数据存储容量，特别适用于各种手持式播放设备的声音重放。

12.

发明授权
一种基于生理特征的全频段3D虚拟声定制方法及装置失效

公开(公告)号：CN106535043B

公开(公告)日：2019-03-05

申请号：CN201611024222.2

申请日：2016-11-18

Applicant: 华南理工大学

Inventor： 钟小丽

IPC: H04R3/00

Abstract: 本发明公开了一种基于生理特征的全频段3D虚拟声定制方法，该方法利用头部和耳廓的生理相似性，分别定制出符合听者听觉特征的低频和高频的头相关传输函数，并采用逐渐过渡合成的方法得到全频段头相关传输函数，进一步将其应用于双耳虚拟声信号的合成。相应的实现装置包括图像获取模块、运算控制模块、虚拟声播放模块。本发明优化了定制所需的生理参数，采用一个头部生理参数和四个耳廓生理参数便可实现全频段的头相关传输函数定制。将上述双耳虚拟声信号用耳机重发，可以减小定位误差、提高听者的沉浸感。

13.

发明公开
一种基于深度学习的声源空间方位检测方法无效

公开(公告)号：CN109031200A

公开(公告)日：2018-12-18

申请号：CN201810504609.0

申请日：2018-05-24

Applicant: 华南理工大学

Inventor： 俞胜锋 , 钟小丽 , 顾正晖

IPC: G01S5/18

CPC classification number: G01S5/18

Abstract: 本发明公开了一种基于深度学习的声源空间方位检测方法，包括步骤：步骤1、采用人工头双麦克风系统捡拾多个声源空间方位的双耳声信号，用于深度神经网络模型的训练；步骤2、对所述深度神经网络模型进行迭代训练，得到一个具有最优参数的分类器；步骤3、输入未知声源方位的双耳信号至训练好的深度神经网络模型，所述深度神经网络模型输出声源空间方位的预测值。相对于现有技术，本发明的硬件实施简便；同时，神经网络信息量大，预测准确性接近人类行为学实验的水平。

14.

发明公开
基于个性化反射声阈值的虚拟声像合成方法、介质和终端失效

公开(公告)号：CN108391199A

公开(公告)日：2018-08-10

申请号：CN201810097353.6

申请日：2018-01-31

Applicant: 华南理工大学

Inventor： 钟小丽 , 郭文英 , 王杰

IPC: H04R1/34 , H04S7/00

Abstract: 本发明公开了一种基于个性化反射声阈值的虚拟声像合成方法、介质和终端，所述合成方法包括如下步骤：步骤1、测定听者自身的个性化反射声阈值；步骤2、根据需要虚拟的声环境的物理和几何特性，设定反射场虚拟声像的参数；步骤3、合成基于个性化反射声阈值的双耳房间脉冲响应BRIR；步骤4、将BRIR与输入的单通路声信号进行卷积运算，馈给耳机重放。本发明基于听者自身的个性化反射声阈值，实现了BRIR合成的简化；在确保听觉效果的前提下，解决了虚拟声像合成中运算量和存储量较大的问题，可促使算法更好地向各种手持移动终端、便携式播放设备移植。

15.

发明公开
一种优化的基于耳机重放的虚拟声合成方法无效

公开(公告)号：CN104240695A

公开(公告)日：2014-12-24

申请号：CN201410438557.3

申请日：2014-08-29

Applicant: 华南理工大学

Inventor： 钟小丽 , 张亮

IPC: G10L13/02 , H04S7/00

Abstract: 本发明公开了一种优化的基于耳机重放的虚拟声合成方法，包括步骤：根据需要虚拟的声环境的物理和几何特性，确定到达倾听者位置的房间脉冲响应RIR；根据RIR中直达声和各个反射声相对于倾听者头中心的到达空间方位，选取对应的头相关脉冲响应HRIR和RIR中直达声和反射声部分分别进行卷积，得到双耳房间脉冲响应BRIR；将虚拟声源的单通路信号和BRIR进行卷积，得到双耳声信号；双耳声信号和耳机传输函数HpTF的逆函数进行卷积，得到耳机补偿后的双耳声信号，馈给耳机重放。本发明可优化信号处理的算法和减小运算量，对合成双耳声信号进行耳机补偿，可较好地解决头中定位和声像畸变的问题，应用广泛。

16.

发明授权
一种基于听觉模型和信源方位的多通路语音降噪方法有权

公开(公告)号：CN111210835B

公开(公告)日：2023-07-18

申请号：CN202010018821.3

申请日：2020-01-08

Applicant: 华南理工大学

Inventor： 杨子晖 , 钟小丽 , 宋昊

IPC: G10L21/0208 , G10L21/0216 , G10L25/30

Abstract: 本发明公开一种基于听觉模型和信源方位的多通路语音降噪方法。该方法将多通路带噪语音信号进行通路分离，导入听觉模型映射成为各个独立通路的语谱灰度图；将语谱灰度图输入方向识别神经网络模型，得到各个独立通路的语声信源的方位；进一步，将语谱灰度图导入相应信源方位的降噪神经网络，降噪神经网络对语谱图有语音部分与无语音部分实施分区降噪处理；将各个独立通路的降噪后语谱图进行逆变换，再进行通路合并，最终获得降噪后的多通路语音信号。本方法利用人类听觉模型将带噪语音信号映射到初级感知域进行处理，更加符合人类生理感知；此外，对不同空间方位的语声信源实施分区域个性化降噪策略，有助于提高降噪的精准度。

17.

发明授权
基于个性化反射声阈值的虚拟声像合成方法、介质和终端失效

公开(公告)号：CN108391199B

公开(公告)日：2019-12-10

申请号：CN201810097353.6

申请日：2018-01-31

Applicant: 华南理工大学

Inventor： 钟小丽 , 郭文英 , 王杰

IPC: H04R1/34 , H04S7/00

Abstract: 本发明公开了一种基于个性化反射声阈值的虚拟声像合成方法、介质和终端，所述合成方法包括如下步骤：步骤1、测定听者自身的个性化反射声阈值；步骤2、根据需要虚拟的声环境的物理和几何特性，设定反射场虚拟声像的参数；步骤3、合成基于个性化反射声阈值的双耳房间脉冲响应BRIR；步骤4、将BRIR与输入的单通路声信号进行卷积运算，馈给耳机重放。本发明基于听者自身的个性化反射声阈值，实现了BRIR合成的简化；在确保听觉效果的前提下，解决了虚拟声像合成中运算量和存储量较大的问题，可促使算法更好地向各种手持移动终端、便携式播放设备移植。

18.

发明授权
一种基于中垂面特性的虚拟声像近似获取方法失效

公开(公告)号：CN107205207B

公开(公告)日：2019-01-29

申请号：CN201710347629.7

申请日：2017-05-17

Applicant: 华南理工大学

Inventor： 钟小丽

IPC: H04S7/00

Abstract: 本发明公开了一种基于中垂面特性的虚拟声像近似获取方法，包括步骤：确定目标虚拟声像所处的混乱锥纵截面和水平面的交点坐标；选取交点处双耳头相关传输函数HRTF，计算双耳时间差；在中垂面上，确定和目标虚拟声像同仰角的空间方位，用该方位的HRTF幅度谱代替目标声像方位HRTF的幅度谱；将目标声像方位的双耳HRTF幅度谱和双耳时间差进行合成，得到目标声像方位HRTF的近似结果；将单通路信号和目标声像方位HRTF进行时间域卷积处理或等价地频率域滤波处理，得到合成的双耳虚拟声信号，输出到耳机进行重放。本发明有效减少所需存储的HRTF的数量，减轻虚拟声像重放系统的负担，特别适用于各种手持式播放设备的声音重放。

19.

发明授权
一种中垂面上近场虚拟声像的合成方法失效

公开(公告)号：CN107105384B

公开(公告)日：2018-11-02

申请号：CN201710347867.8

申请日：2017-05-17

Applicant: 华南理工大学

Inventor： 钟小丽

IPC: H04S7/00

Abstract: 本发明涉及一种中垂面上近场虚拟声像的合成方法，包括以下步骤：已知远场头相关传输函数HRTFfar，其中声源和头中心的距离D；确定人头半径a以及中垂面上近场目标声像和头中心的距离d；根据公式，计算右耳R的修正角度θ；提取远场HRTFfar(θ，R)作为近场目标声像的右耳HRTF；根据中垂面的左右对称性，提取远场HRTFfar(‑θ，L)作为近场目标声像的左耳HRTF；将近场目标声像的双耳HRTF和输入声信号进行卷积，可实现基于耳机的中垂面近场声像的3D虚拟重放。本发明提供的方法利用远场HRTF推知近场HRTF，可以简便地实现中垂面近场虚拟声像的合成，省去近场HRTF繁琐的测量过程。

20.

发明公开
一种基于中垂面特性的虚拟声像近似获取方法失效

公开(公告)号：CN107205207A

公开(公告)日：2017-09-26

申请号：CN201710347629.7

申请日：2017-05-17

Applicant: 华南理工大学

Inventor： 钟小丽

IPC: H04S7/00

CPC classification number: H04S7/304 , H04S7/302 , H04S2420/01

Abstract: 本发明公开了一种基于中垂面特性的虚拟声像近似获取方法，包括步骤：确定目标虚拟声像所处的混乱锥纵截面和水平面的交点坐标；选取交点处的双耳头相关传输函数HRTF，计算双耳时间差；在中垂面上，确定和目标声像同仰角的空间方位，用该方位的HRTF幅度谱代替目标声像方位HRTF的幅度谱；将目标声像方位的双耳HRTF幅度谱和双耳时间差进行合成，得到目标声像方位HRTF的近似结果；将单通路信号和目标声像方位HRTF进行时间域卷积处理或等价地频率域滤波处理，得到合成的双耳虚拟声信号，输出到耳机进行重放。本发明有效减少所需存储的HRTF的数量，减轻虚拟声像重放系统的负担，特别适用于各种手持式播放设备的声音重放。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification