-
公开(公告)号:CN112653980A
公开(公告)日:2021-04-13
申请号:CN202110035197.2
申请日:2021-01-12
Applicant: 东南大学
IPC: H04R25/00
Abstract: 本发明公开了一种智能助听器交互式自验配方法,包括如下步骤:步骤1,听障患者倾听助听器发出的测试语音进行五级评价,并形成助听器声音质量评价指标;步骤2,根据患者的11维听力图,3维个性信息,语音评价形成特征序列,然后计算其与验配历史数据库中的特征序列的相似度步骤3,设计参数调整的价值函数,计算参数调整策;略的价值,使得每次参数调整的价值最大化;步骤4,构建神经网络,获得神经网络的权值;步骤5,将测试语音频谱,语音评价,患者个性信息以及连续3组历史参数调整策略输入神经网络,重新生成测试语音给听障患者进行评价。本发明综合考虑主客观语音评价方法,结合深度学习网络,将认知和个人因素融入助听器设计,应用前景好。
-
公开(公告)号:CN120070659A
公开(公告)日:2025-05-30
申请号:CN202510046011.1
申请日:2025-01-13
Applicant: 东南大学
IPC: G06T11/60 , G01S11/14 , G01S5/22 , G06N5/04 , G06N7/01 , G06F17/16 , G06T7/70 , G06T7/80 , G06T7/90
Abstract: 本发明公开了一种基于稀疏表征与变分贝叶斯推断的多声源定位与成像方法,步骤如下:(1)采用常规波束形成算法在低分辨率下生成初始声强矩阵,估计声源位置;(2)计算信号强度梯度,沿梯度方向更新搜索位置,获得准确的声源位置和高分辨率声强矩阵;(3)使用稀疏字典学习算法对高分辨率声强矩阵进行稀疏编码和字典更新优化;(4)基于稀疏系数构建变分贝叶斯推断模型,优化变分下界,进行多声源的后验定位估计;(5)将定位结果与摄像头图像融合,得到声源的可视化位置。该方法通过结合低分辨率定位、梯度优化、稀疏字典学习与贝叶斯推断,在复杂声场中实现高精度实时定位与成像,具有较高的空间分辨率和较强的抗干扰能力。
-
公开(公告)号:CN119889338A
公开(公告)日:2025-04-25
申请号:CN202411912274.8
申请日:2024-12-24
Applicant: 东南大学
IPC: G10L21/0208 , G10L21/0216 , G10L21/0232
Abstract: 本发明公开了基于多尺度空间信息与频谱特征融合的多通道语音增强方法,根据频谱特性将不同频谱成分重新组合,提取通道内、通道间以及全通道的特征模式;并对上述特征进行融合,创建统一深度特征;引入局部特征提取模块增强当前帧特征权重并通过特征注意力机制融合不同尺度下的特征;引入分解注意力机制,在多个分解空间融合编码器和解码器输出,让细节特征也能被深度模块使用。本发明将空间特征和频谱特征相结合,利用特征融合方法创建统一的特征表达。通过注意力模块自适应学习空间特征中所包含的模式并加以利用,而非拟合具有物理含义的方向性特征,能够更灵活地适应不同的场景,具有良好的应用前景。
-
公开(公告)号:CN114786107B
公开(公告)日:2023-08-22
申请号:CN202210508181.3
申请日:2022-05-10
Applicant: 东南大学
IPC: H04R25/00
Abstract: 本发明公开了一种助听器验配方法,包括:步骤S1、获得听障患者实际测量不少于8个频点的听力图数据;如果少于8个频点,则线性插值得到8点听力图数据;步骤S2、根据听障患者的8点听力图数据,计算得到患者在当前声压级下几个关键频率的验配补偿预测值;步骤S3、以关键频率的验配补偿预测值为基础,进行分段线性插值,得到全部19个频率的验配补偿预测值,实现智能助听器非线性验配公式的拟合。本发明给出了一种助听器非线性验配公式的实现方法,以经典拟合思路实现非线性验配公式的增益补偿计算,通过最小二乘法的线性回归和多项式回归保证了多项式拟合的精度,丰富了非线性验配公式的实现思路。
-
公开(公告)号:CN112653980B
公开(公告)日:2022-02-18
申请号:CN202110035197.2
申请日:2021-01-12
Applicant: 东南大学
IPC: H04R25/00
Abstract: 本发明公开了一种智能助听器交互式自验配方法,包括如下步骤:步骤1,听障患者倾听助听器发出的测试语音进行五级评价,并形成助听器声音质量评价指标;步骤2,根据患者的11维听力图,3维个性信息,语音评价形成特征序列,然后计算其与验配历史数据库中的特征序列的相似度步骤3,设计参数调整的价值函数,计算参数调整策;略的价值,使得每次参数调整的价值最大化;步骤4,构建神经网络,获得神经网络的权值;步骤5,将测试语音频谱,语音评价,患者个性信息以及连续3组历史参数调整策略输入神经网络,重新生成测试语音给听障患者进行评价。本发明综合考虑主客观语音评价方法,结合深度学习网络,将认知和个人因素融入助听器设计,应用前景好。
-
公开(公告)号:CN106303874B
公开(公告)日:2019-03-19
申请号:CN201610974157.3
申请日:2016-10-28
Applicant: 东南大学
IPC: H04R25/00
Abstract: 本发明公开了一种数字助听器中自适应验配方法。传统的助听器验配过程离不开听力专家,验配的结果好坏直接取决于听力专家的专业水平,此外,对于发展中国家而言,相当一部分地区的医疗条件达不到验配标准,利用本方法可以有效地实现助听器的自适应验配,即脱离验配专家的助听器验配过程。本发明以二维高斯分布的求和形式作为验配模型,以交互式进化计算作为寻优方法,结合本发明设计的人机交互接口,通过30代以内的人机交互即可确定数字助听器的验配模型。实验结果表明,本发明提出的方法可以有效地实现数字助听器的自适应验配,摆脱了听力专家对于数字助听器验配过程的限制。
-
公开(公告)号:CN105047194B
公开(公告)日:2018-08-28
申请号:CN201510450338.1
申请日:2015-07-28
Applicant: 东南大学
Abstract: 本发明公开了一种用于语音情感识别的自学习语谱图特征提取方法,首先对已知情感的标准语料库中的语音进行预处理,得到量化后的语谱图灰度图像;然后计算所得到的语谱图灰度图像的Gabor语谱图;再采用可辨别特征学习算法对提取到的LBP统计直方图进行训练,构建不同尺度、不同方向下的全局显著性模式集合;最后采用全局显著性集合对语音不同尺度、不同方向下Gabor图谱的LBP统计直方图进行特征选择,得到处理后的统计直方图,将N个统计直方图级联,得到适合情感分类的语音情感特征。本发明提出的情感特征可以较好地识别不同种类的情感,识别率显著优于现有的声学特征。
-
公开(公告)号:CN105307093A
公开(公告)日:2016-02-03
申请号:CN201510835800.X
申请日:2015-11-26
Applicant: 东南大学
IPC: H04R25/00
Abstract: 本发明公开了一种自适应的听力补偿方法,本发明包括以下步骤:首先利用gammatone滤波器组对输入信号进行多通道分解,然后根据通道内信号的动态范围以及听损患者的听觉范围确定补偿方法,若通道信号经线性增益处理后仍在患者的听觉范围内则使用线性放大进行听力补偿以减小畸变,否则使用动态范围压缩进行补偿以增加可听度。另外,为减小动态范围压缩带来的信号畸变,提高噪声环境下输出信号的信噪比,采用自适应压缩方法进行听力补偿,使压缩比尽量接近于1。本发明相比已有的听力补偿方法,本发明补偿后的语音可懂度更高,具有很强的实用性。
-
-
-
-
-
-
-