-
公开(公告)号:CN107451961B
公开(公告)日:2020-11-17
申请号:CN201710502538.6
申请日:2017-06-27
Applicant: 重庆邮电大学
Abstract: 本发明请求保护一种多幅模糊噪声图像下清晰图像的恢复方法,属于真实自然界的模糊和噪声图像的重建方法,研究发现模糊核与清晰图像在很多域都具有稀疏表示形式,而组稀疏域通过探索局部和非局部信息具有更好的稀疏表示形式。本发明通过利用模糊核与清晰图像的这个特点构造联合优化方程,并通过相应算法进行求解。经过对算法进行理论分析和计算机仿真分析表明,提出的算法性能更优越,在信号处理、图像处理等领域中有着良好的应用前景。
-
公开(公告)号:CN111341340A
公开(公告)日:2020-06-26
申请号:CN202010129648.4
申请日:2020-02-28
Applicant: 重庆邮电大学
IPC: G10L21/0216 , G10L21/0208
Abstract: 本发明涉及一种基于相干性和能量比的鲁棒GSC方法,属于麦克风阵列语音增强技术领域,包括以下步骤:S1:在上支路部分使用超指向固定波束形成器输出期望信号,并与原始信号求相干性;S2:使用延迟求和固定波束形成器输出信号,并与原始信号在一定频率范围内求信干能量比;S3:用求出的相干性与能量比联合控制自适应噪声相消器ANC的更新。相比于传统的GSC算法,本方案具有更好的低频特性和波束指向性,通过相干性与能量比联合控制ANC更新,防止了ANC在语音段对期望信号的误消问题,具有更强的鲁棒性。
-
公开(公告)号:CN111341332A
公开(公告)日:2020-06-26
申请号:CN202010129725.6
申请日:2020-02-28
Applicant: 重庆邮电大学
IPC: G10L21/02 , G10L21/0208 , G10L25/21 , G10L25/30
Abstract: 本发明涉及一种基于深度神经网络的语音特征增强后置滤波方法,属于语音滤波技术领域,包括以下步骤:S1:将纯净语音与噪声按不同信噪比混合,生成训练数据;S2:选择训练数据的对数功率谱LPS作为特征进行提取,以纯净语音的LPS作为目标;S3:使用标准结构深度神经网络DNN进行训练;S4:对训练结果进行损失估计;S5:输入损失语音,基于损失估计进行损失补偿。相比于现有技术,本发明能够在保证语音质量的同时有效抑制噪声干扰。
-
公开(公告)号:CN108133179A
公开(公告)日:2018-06-08
申请号:CN201711297039.4
申请日:2017-12-08
Applicant: 重庆邮电大学
IPC: G06K9/00
CPC classification number: G06K9/00503
Abstract: 本发明涉及一种用于非线性回声消除的抗冲击核函数自适应滤波算法,属于信号处理领域。本发明部分更新技术通过在每一个迭代时刻选择一部分而非全部滤波器系数进行更新,从而减少了运算开销,在保证收敛速度以获得满意的回波消除效果的同时尽量降低算法的运算量。同时,结合鲁棒统计的M-估计,系统地研究了提高NLAEC应用中核函数自适应滤波算法抗脉冲干扰性能的行之有效的技术,对进一步理解这些技术带来的算法性能提升,如快速收敛和跟踪,防止双端讲话时算法发散有很大的帮助。
-
公开(公告)号:CN106782593A
公开(公告)日:2017-05-31
申请号:CN201710109956.9
申请日:2017-02-27
Applicant: 重庆邮电大学
IPC: G10L21/0208 , G10L21/0232 , G10L21/0264 , G10L21/034 , G10L25/18 , G10L25/78
Abstract: 本发明公开了一种用于声学回声消除的多带结构自适应滤波器切换方法,首先获取远端语音信号;然后检测语音端点,输出VAD标志位以及改进的包络判决阈值;语音信号送入扬声器作为期望信号,同时输入到自适应滤波器;自适应滤波器采用可切换的多带结构和相应的自适应算法,根据反馈信息,利用最小均方准则,调整滤波器参数,得到最优解;本发明提供的切换方法是在保证了稳态失调的情况下,充分考虑语音特性,利用了算法在收敛速度上的优势,同时实现了和算法复杂度的优化配置。在对回声消除的实际应用中,单一算法很难满足各种多变的需求,而本发明中可变的切换算法为使用者提供了更多的可能性,这对于自适应回声消除的应用有重要的意义。
-
公开(公告)号:CN119724152A
公开(公告)日:2025-03-28
申请号:CN202411925962.8
申请日:2024-12-25
Applicant: 重庆邮电大学
IPC: G10L13/08 , G10L21/0208 , G06N20/00
Abstract: 本发明属于音频生成与处理领域,涉及基于平衡信噪比感知的文本到音频生成蒸馏方法,包括:获取文本并输入训练好的学生模型,得到音频;学生模型的训练过程包括:根据教师模型初始化学生模型;根据文本和音频数据得到文本特征τ和音频特征z0;将特征τ、z0输入教师模型,将教师模型的输出和特征τ输入学生模型;根据教师模型和学生模型的输出计算BSA损失函数值更新学生模型的参数,当学生模型达到预设的训练次数时,若达到最大蒸馏次数,得到训练好的学生模型;否则根据学生模型设置教师模型的参数并进行下一次蒸馏;本发明结合BSA损失函数,优化了教师模型与学生模型之间的知识传递,使得蒸馏过程在不同信噪比条件下均能保持较高的稳定性和准确性。
-
公开(公告)号:CN108039179B
公开(公告)日:2021-08-13
申请号:CN201711330002.7
申请日:2017-12-13
Applicant: 重庆邮电大学
IPC: G10L21/0216 , G10L21/0264
Abstract: 本发明涉及一种用于麦克风阵列广义旁瓣消除器的高效自适应算法,属于信号处理技术领域。该方法包括步骤S1:将GPAPA计算权值比例因子的方法引入MPAPA算法,得到MGPAPA算法;S2:将MGPAPA算法引入GSC的ANC模块。本发明采用的MGPAPA算法相比传统GSC中ANC模块采用的NLMS算法具有更快的收敛速度和更低的稳态误差;相比LMS/Newton算法具有更少的计算量。同时整合了GPAPA算法计算权值比例因子的方法,相比MPAPA算法,减少了对脉冲响应疏密程度的敏感度。该算法通过改善ANC的自适应滤波性能,提升了GSC的降噪效果。
-
公开(公告)号:CN112584299A
公开(公告)日:2021-03-30
申请号:CN202011451333.8
申请日:2020-12-09
Applicant: 重庆邮电大学
Abstract: 本发明涉及一种基于多激励平板扬声器的沉浸式会议系统,属于视频会议技术领域。该系统由多媒体硬件终端和音视频控制中枢组成;多媒体硬件终端包括:多激励平板扬声器、投影仪、摄像头、麦克风阵列;音视频控制中枢包括:空间音频驱动单元、音频处理单元、视频播放控制单元以及视频处理单元。本发明系统改进了音视频播放形式,使用WFS技术作为声音呈现方式,并且使用多激励平板式扬声器作为音频播放终端,同时也能够作为视频播放的屏幕载体,与传统会议系统相比,能够得到音视频一致的沉浸式体验,同时能够节约会议房间的空间利用率,增大视觉与听觉感知范围。
-
公开(公告)号:CN104463929B
公开(公告)日:2017-07-18
申请号:CN201410783008.X
申请日:2014-12-16
Applicant: 重庆邮电大学
IPC: G06T11/00
Abstract: 本发明涉及一种基于图像边缘检测信号相关性的室内WLAN信号地图绘制与映射方法,该方法首先利用随机用户采集的接收信号强度RSS序列,通过谱聚类构建各RSS序列的聚类图;其次,利用图像边缘检测法,构建随机用户在定位目标区域内的信号逻辑图;再者,根据相应的映射准则,建立信号逻辑图中的RSS聚类节点到物理环境图中的区域位置节点之间的映射;最终利用信号逻辑图到物理环境图的映射关系,实现对目标用户的位置估计,同时利用绘图技术对信号逻辑图及物理环境图进行绘制,提高了图的可读性,使得信号逻辑图及物理环境图中各节点的连接关系更加明晰。
-
公开(公告)号:CN118380006A
公开(公告)日:2024-07-23
申请号:CN202410482669.2
申请日:2024-04-22
Applicant: 重庆邮电大学
IPC: G10L21/0208 , G10L21/0216 , G10L21/0272 , G10L21/0232 , G10L25/30 , G10L25/84 , G10L25/51
Abstract: 本发明属于信号处理领域,涉及一种Ambisoncis语音增强方法,包括:获取一阶Ambisonics麦克风采集的带噪FOA语音信号,将FOA语音信号输入训练好的FOA‑DPCRN模型,得到估计的干净语音信号;所述FOA‑DPCRN模型包括:相位指导模块、W降噪模块、声强矢量提取器、复数DPCRN模块;本发明对W通道的语音信号进行降噪,根据W降噪特征得到反投影掩码,并根据反投影掩码将X、Y、Z通道的语音信号反投影到W通道上以提供更清晰的反投影指导;本发明结合相位指导特征和声强矢量特征来进一步区分噪声和目标语音;本发明通过在复数编码器后嵌入相位指导特征使网络能更加充分显式地利用语音空间特征信息。
-
-
-
-
-
-
-
-
-