-
公开(公告)号:CN105512663A
公开(公告)日:2016-04-20
申请号:CN201510869726.3
申请日:2015-12-02
Applicant: 南京邮电大学
IPC: G06K9/46
CPC classification number: G06K9/4642 , G06K9/4671
Abstract: 本发明公开了一种基于全局与局部对比度的显著性检测方法,该方法是基于三个显著性操作。第一个,CESC,认为就其周围的图像补丁块的稀缺性。第二个,CSC,通过考虑中心补丁块与其周围补丁块的相对位置拓展CESC算法。第三个,GC,利用其在整个图像的对比度的图像的补丁计算显著性。最后,这三个对比图进行合并。在RGB色彩空间下,检测结果比现有方法更简单并行之有效,其显著图更贴合于人眼的视觉感知系统所得到的结果,显著性检测质量高,且检测结果受图像的物理条件,光学条件,色彩差异影响小;本发明不受样本限制,更适于实际应用。
-
公开(公告)号:CN110148419A
公开(公告)日:2019-08-20
申请号:CN201910337555.8
申请日:2019-04-25
Applicant: 南京邮电大学
IPC: G10L21/0208 , G10L21/0264 , G10L21/0308 , G10L25/30
Abstract: 本发明揭示了一种基于深度学习的语音分离方法,首先是将含有多个语音的信号划分为训练集信号和测试集信号,并将训练集信号与测试集信号分别进行预处理,之后进行傅里叶变换,得到训练集信号的幅度和相位、及测试集信号的幅度和相位,然后再将训练集信号的幅度和相位、及测试集信号的幅度和相位均进行归一化处理;接着将归一化处理后训练集信号的幅度和相位通过训练模型进行训练,且训练模型的算法采用深度神经网络的adam算法;最后将归一化处理后测试集信号通过训练模型预测,并完成语音分离;本发明将幅度与相位联合训练,在真实环境下语音分离效果更佳;另外,本发明采用深度神经网络的adam算法,使信噪比与语音的可懂度得到大幅度提高。
-