-
公开(公告)号:CN109618274B
公开(公告)日:2021-02-19
申请号:CN201811406368.2
申请日:2018-11-23
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于角度映射表的虚拟声重放方法、电子设备及介质,所述方法包括步骤:步骤1、输入拟重放的目标虚拟声像的距离和空间方位角度;步骤2、检索角度映射表,提取出匹配空间方位角度;步骤3、从基准距离的HRTF数据库中提取出与匹配空间方位角度对应的HRTF数据,作为目标虚拟声像的匹配HRTF;步骤4、采用匹配HRTF对拟重放的单通路声信号进行滤波,获得双耳重放信号,进一步馈给耳机或扬声器重放。本发明基于单个距离(即基准距离)的HRTF数据,可实现任意多个距离的虚拟声像重放,降低了对硬件设备的存储要求。
-
公开(公告)号:CN109618274A
公开(公告)日:2019-04-12
申请号:CN201811406368.2
申请日:2018-11-23
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于角度映射表的虚拟声重放方法、电子设备及介质,所述方法包括步骤:步骤1、输入拟重放的目标虚拟声像的距离和空间方位角度;步骤2、检索角度映射表,提取出匹配空间方位角度;步骤3、从基准距离的HRTF数据库中提取出与匹配空间方位角度对应的HRTF数据,作为目标虚拟声像的匹配HRTF;步骤4、采用匹配HRTF对拟重放的单通路声信号进行滤波,获得双耳重放信号,进一步馈给耳机或扬声器重放。本发明基于单个距离(即基准距离)的HRTF数据,可实现任意多个距离的虚拟声像重放,降低了对硬件设备的存储要求。
-
公开(公告)号:CN106535043A
公开(公告)日:2017-03-22
申请号:CN201611024222.2
申请日:2016-11-18
Applicant: 华南理工大学
Inventor: 钟小丽
IPC: H04R3/00
CPC classification number: H04R3/00 , H04R2430/00
Abstract: 本发明公开了一种基于生理特征的全频段3D虚拟声定制方法,该方法利用头部和耳廓的生理相似性,分别定制出符合听者听觉特征的低频和高频的头相关传输函数,并采用逐渐过渡合成的方法得到全频段头相关传输函数,进一步将其应用于双耳虚拟声信号的合成。相应的实现装置包括图像获取模块、运算控制模块、虚拟声播放模块。本发明优化了定制所需的生理参数,采用一个头部生理参数和四个耳廓生理参数便可实现全频段的头相关传输函数定制。将上述双耳虚拟声信号用耳机重发,可以减小定位误差、提高听者的沉浸感。
-
公开(公告)号:CN111246363B
公开(公告)日:2021-07-20
申请号:CN202010019433.7
申请日:2020-01-08
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于听觉匹配的虚拟声定制方法及装置。本发明的方法包括:从用户头部3D模型中提取HRTF相关的生理特征值;输入听觉评估神经网络,预测听觉分数;从已知HRTF数据库中挑选出最高听觉分数所对应的HRTF数据,作为用户听觉匹配的HRTF数据;将原始单通路信号、听觉匹配HRTF数据、房间脉冲响应依次进行时间域卷积处理或等价地频率域滤波处理,得到用户定制的双耳虚拟声信号。本发明利用现有移动终端的3D传感装置,涵盖了HRTF相关的生理特征量;同时,直接建立生理特征值和主观听感的非线性关系,提高了HRTF匹配以及虚拟声定制的精度,有助于降低虚拟声重放设备的定位误差、提高用户沉浸感。
-
公开(公告)号:CN111246363A
公开(公告)日:2020-06-05
申请号:CN202010019433.7
申请日:2020-01-08
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于听觉匹配的虚拟声定制方法及装置。本发明的方法包括:从用户头部3D模型中提取HRTF相关的生理特征值;输入听觉评估神经网络,预测听觉分数;从已知HRTF数据库中挑选出最高听觉分数所对应的HRTF数据,作为用户听觉匹配的HRTF数据;将原始单通路信号、听觉匹配HRTF数据、房间脉冲响应依次进行时间域卷积处理或等价地频率域滤波处理,得到用户定制的双耳虚拟声信号。本发明利用现有移动终端的3D传感装置,涵盖了HRTF相关的生理特征量;同时,直接建立生理特征值和主观听感的非线性关系,提高了HRTF匹配以及虚拟声定制的精度,有助于降低虚拟声重放设备的定位误差、提高用户沉浸感。
-
公开(公告)号:CN104394499A
公开(公告)日:2015-03-04
申请号:CN201410676824.0
申请日:2014-11-21
Applicant: 华南理工大学
IPC: H04S7/00
Abstract: 本发明公开了一种基于视听交互的虚拟声重放校正装置,包括:上位机控制模块,用于合成不同空间方位虚拟声信号、控制虚拟声信号按一定顺序和次数向声音信号播放模块及视觉信号播放模块的发送,以及分析比较倾听者的反馈信息以判断校正是否符合预期;听觉信号播放模块,用于根据上位机控制模块的控制信号播放合成的相应空间方位的虚拟声的音频信号;视觉信号播放模块,用于根据上位机控制模块的控制信号可视化显示虚拟声的方位信息;反馈模块。本发明还公开一种基于视听交互的虚拟声重放校正方法。本发明可校正虚拟声重放中非个性化信号处理所导致的定位精度下降、前后混乱率高等缺陷,实现方式简单、成本低廉,有利于广泛推广应用。
-
公开(公告)号:CN103237287A
公开(公告)日:2013-08-07
申请号:CN201310109533.9
申请日:2013-03-29
Applicant: 华南理工大学
Abstract: 本发明公开了一种具定制功能的5.1通路环绕声耳机重放信号处理方法,采用头相关传输函数对输入的5.1通路环绕声信号进行滤波,将5.1通路环绕声信号转换为适合一对耳机重放的双耳信号。本发明提供七组具有代表性的头相关传输函数数据供用户选择,该方法能减少5.1通路环绕声的双耳(虚拟)耳机重放中虚拟声源头中定位、前后混乱、感知仰角错误等问题,同时使主观试听选择匹配头相关传输函数数据过程简单易行,也减少了所需要的系统数据存储容量,特别适用于各种手持式播放设备的声音重放。
-
公开(公告)号:CN111246345B
公开(公告)日:2021-09-21
申请号:CN202010019188.X
申请日:2020-01-08
Applicant: 华南理工大学
Abstract: 本发明公开一种远程声场实时虚拟重现的方法与装置。该方法包括:(1)采用端对端的卷积神经网络,由用户耳部图像推知个性化的仰角定位因素,并以此为依据对通用HRTF进行个性化定制,进一步将定制的个性化HRTF应用于双耳虚拟声信号的合成;(2)基于用户头部位置的实时检测,实现跟踪头部位置的动态双耳虚拟声信号的重放。上述个性化定制和实时动态的虚拟声信号处理方法可以增强用户的现场感和沉浸感。所述装置包括远程声场多通路捡拾模块、云处理模块、用户端模块和5G通讯模块。本发明的实施基于云计算技术和5G网络传输,可有效减轻用户端的运算负荷,满足多用户的并行需求。本发明可视为基于移动便携设备的虚拟现实的声模块方案。
-
公开(公告)号:CN111246345A
公开(公告)日:2020-06-05
申请号:CN202010019188.X
申请日:2020-01-08
Applicant: 华南理工大学
Abstract: 本发明公开一种远程声场实时虚拟重现的方法与装置。该方法包括:(1)采用端对端的卷积神经网络,由用户耳部图像推知个性化的仰角定位因素,并以此为依据对通用HRTF进行个性化定制,进一步将定制的个性化HRTF应用于双耳虚拟声信号的合成;(2)基于用户头部位置的实时检测,实现跟踪头部位置的动态双耳虚拟声信号的重放。上述个性化定制和实时动态的虚拟声信号处理方法可以增强用户的现场感和沉浸感。所述装置包括远程声场多通路捡拾模块、云处理模块、用户端模块和5G通讯模块。本发明的实施基于云计算技术和5G网络传输,可有效减轻用户端的运算负荷,满足多用户的并行需求。本发明可视为基于移动便携设备的虚拟现实的声模块方案。
-
公开(公告)号:CN111210835A
公开(公告)日:2020-05-29
申请号:CN202010018821.3
申请日:2020-01-08
Applicant: 华南理工大学
IPC: G10L21/0208 , G10L21/0216 , G10L25/30
Abstract: 本发明公开一种基于听觉模型和信源方位的多通路语音降噪方法。该方法将多通路带噪语音信号进行通路分离,导入听觉模型映射成为各个独立通路的语谱灰度图;将语谱灰度图输入方向识别神经网络模型,得到各个独立通路的语声信源的方位;进一步,将语谱灰度图导入相应信源方位的降噪神经网络,降噪神经网络对语谱图有语音部分与无语音部分实施分区降噪处理;将各个独立通路的降噪后语谱图进行逆变换,再进行通路合并,最终获得降噪后的多通路语音信号。本方法利用人类听觉模型将带噪语音信号映射到初级感知域进行处理,更加符合人类生理感知;此外,对不同空间方位的语声信源实施分区域个性化降噪策略,有助于提高降噪的精准度。
-
-
-
-
-
-
-
-
-