一种基于多域空间属性关联分析的行人辨识方法

    公开(公告)号:CN110738167A

    公开(公告)日:2020-01-31

    申请号:CN201910973108.1

    申请日:2019-10-14

    Applicant: 武汉大学

    Abstract: 本发明公开了一种基于多域空间属性关联分析的行人辨识方法。首先,将相似性度量转化为对象的差异性分布计算,统计真实和虚假对象视觉相似度概率差异性分布,利用分布的可分离性确定两个分布最大可分阈值;然后根据真实/虚假对象可分性阈值计算对象在已知手机信号轨迹下的联合概率,利用联合概率度量对象属性间的关联性;根据联合概率排序确定身份属性与对象跟身份的强关联映射关系。本发明公开的方法在两个数据集上的测试结果证明该方法的有效性,相较无监督条件下的行人辨识技术有较大提升。

    用于提高三维音频空间参数压缩率的编解码方法及系统

    公开(公告)号:CN106023999B

    公开(公告)日:2019-06-11

    申请号:CN201610541939.8

    申请日:2016-07-11

    Applicant: 武汉大学

    Abstract: 本发明提供了用于提高三维音频空间参数压缩率的编解码方法及系统,本发明在编码时输入三维音频的音频信号、三维音频的空间边信息和空间参数所属音频对象的编号,编码时依次对空间参数进行聚类、量化、帧内编码、帧间差分编码;解码时依次进行帧间差分解码、帧内解码、反量化、空间参数映射;本发明基于同一声源同一帧内的不同子带空间参数具有相似性的特点,采用空间参数聚类的方法来提高三维音频的空间参数的压缩率,可以得到更高的三维音频空间参数压缩率。

    联合声道间和声道内预测的立体声误码隐藏方法及系统

    公开(公告)号:CN105654957B

    公开(公告)日:2019-05-24

    申请号:CN201510992687.6

    申请日:2015-12-24

    Applicant: 武汉大学

    Abstract: 本发明提供了一种联合声道间和声道内预测的立体声误码隐藏方法及系统,包括:S1利用上一帧两声道数据生成第一维纳滤波器,基于相邻帧的声道间数据关系相似原理,采用第一维纳滤波器和当前帧第一声道数据预测出当前帧第二声道数据S1(n);S2利用上一帧第二声道数据及上一帧第二声道的相似帧生成第二维纳滤波器,采用第二维纳滤波器和当前帧第二声道的相似帧预测出当前帧第二声道数据S2(n);S3采用S1(n)和S2(n)重构当前帧第二声道数据。本发明联合声道间预测数据和声道内数据共同对误码数据进行恢复,充分考虑到了声道间和声道内的数据的共同作用,从而可进一步提高解码音频的质量。

    基于全局显著边缘区域的人体动作特征提取方法

    公开(公告)号:CN105550678B

    公开(公告)日:2019-01-18

    申请号:CN201610075788.1

    申请日:2016-02-03

    Applicant: 武汉大学

    Abstract: 本发明公开了基于全局显著边缘区域的人体动作特征提取方法,利用一个区域和整个图像的对比度来计算显著度;减少色彩空间的颜色数量,平滑颜色空间的显著度;根据相邻区域的空间关系计算显著性区域;对二值化阈值分割出的前景区域做形态学梯度变化,生成全局显著边缘区域;遍历视频帧不同尺度下所有网格的强角点;在显著边缘区域采集光流幅值不为零的关键特征点;根据修正后光流场求强角点的位移;用强角点连续多帧坐标位移轨迹,以及邻域梯度矢量形成人体动作局部时空特征。本发明通过全局显著边缘区域提取动作特征,剔除与人体运动无关的背景噪声点,消除相机运动对光流计算的影响,提升人体动作局部时空特征描述的精确性,提高人体行为识别率。

    一种基于上下文线性模型的人脸超分辨率处理方法及系统

    公开(公告)号:CN105701770B

    公开(公告)日:2018-12-14

    申请号:CN201610031339.7

    申请日:2016-01-18

    Applicant: 武汉大学

    Abstract: 本发明公开了一种基于上下文线性模型的人脸超分辨率处理方法及系统,通过构建训练库;采用相同的分块方式将待处理低分辨率人脸图像和训练库中图像划分为具交叠部分的图像块;对待处理低分辨率人脸图像块,逐一构建毗邻块空间;用目标位置的块的每一个毗邻块,辅助估计出对应的高分辨率块,得到一个高分辨率块集合;通过分别计算待处理低分辨率图像和训练库中低分辨率图像中,目标块与毗邻块的关系,决定在低分辨率库中的权重系数;融合高分辨率估计集合为一个高分辨率估计块;最终拼接高分辨率人脸图像块。本发明可显著提高恢复图像的视觉感受,特别适用于低质量监控环境下人脸图像的恢复。

    一种基于柯西正则化的人脸超分辨率方法

    公开(公告)号:CN106157251B

    公开(公告)日:2018-10-26

    申请号:CN201510151907.2

    申请日:2015-04-01

    Applicant: 武汉大学

    Abstract: 一种基于柯西正则化的人脸超分辨率方法,包括对输入的低分辨率人脸图像、低分辨率训练集中的低分辨率人脸样本图像以及高分辨率训练集中的高分辨率人脸样本图像划分相互重叠的图像块;分别建立高、低分辨率图像块集作为高、低分辨率图像块字典;用低分辨率图像块字典表示该图像块,利用柯西约束项求解重建系数,然后利用此重建系数和高分辨率图像块字典重建出新的高分辨率图像块;根据低分辨率图像块的位置关系将所得的高分辨率图像块融合成高分辨率图像。本发明在最小二乘法的基础上对重建系数加上柯西约束,本发明可得到了更高质量、与真实情况更为接近的重建效果。

    基于深度神经网络的音频带宽扩展编码解码方法及装置

    公开(公告)号:CN105070293B

    公开(公告)日:2018-08-21

    申请号:CN201510549716.1

    申请日:2015-08-31

    Applicant: 武汉大学

    Abstract: 本发明公开了一种基于深度神经网络的音频带宽扩展编码解码方法,装置包括编码单元与解码单元。编码单元包络预处理模块、高频参数提取模块、低频编码模块、码流生成模块;解码单元包括码流输入模块、高频参数解码模块、低频信号解码模块、自编码器参数预测模块、深度神经网络精细结构预测模块、高频信号重构模块、信号合成模块。本发明首先利用信号低频部分与高频部分存在的自相关性,使用深度神经网络预测的方法,预测高频部分的精细结构。再将精细结构与编码端得到高频部分的边信息相结合,重构出信号的高频部分。最后将信号高频部分与低频部分融合,得到最终的恢复信号。本发明相比传统方法在码率上大幅降低,且音质与传统方法相当。

    边缘数据驱动的鲁棒性人脸超分辨率处理方法及系统

    公开(公告)号:CN105335930B

    公开(公告)日:2018-05-29

    申请号:CN201510711642.7

    申请日:2015-10-28

    Applicant: 武汉大学

    Abstract: 本发明公开一种边缘数据驱动的鲁棒性人脸超分辨率处理方法及系统,包括:包括:S1:构建训练库;S2:采用相同的分块方式将待处理低分辨率人脸图像和训练库中图像划分为具交叠部分的图像块;S3:对训练库中低分辨率人脸图像和待处理低分辨率人脸图像中各图像块分别提取对应的边缘约束块;S4:生成待处理低分辨率人脸图像中图像块的重建系数;S5:根据重建系数恢复图像块,获得其对应的高分辨率人脸图像块;S6:拼接高分辨率人脸图像块。本发明可显著提高恢复图像的视觉感受,特别适用于低质量监控环境下人脸图像的恢复。

    切换模式的音频带宽扩展装置与方法

    公开(公告)号:CN104269173B

    公开(公告)日:2018-03-13

    申请号:CN201410524839.5

    申请日:2014-09-30

    Abstract: 本发明涉及一种切换模式的音频带宽扩展编解码装置与方法,将输入的带宽信号进行语音信号、音频信号的分类并根据分类进行变换域带宽扩展编码或线性预测带宽扩展编码的选择,对高频信号或低频信号进行编码;根据不同的编码方式选择解码方式,合成高频信号。本发明综合考虑了语音和音频信号的类型差异,针对不同信号采用不同的带宽扩展策略。与AVS‑P10编码器相比,主观听力MOS分略有提升,客观质量信噪比提升明显。

    一种ISF系数矢量量化的方法与装置

    公开(公告)号:CN104269176B

    公开(公告)日:2017-11-24

    申请号:CN201410524836.1

    申请日:2014-09-30

    Abstract: 本发明涉及一种ISF系数矢量量化方法与装置,将训练好的多区域码表中的ISF系数转化为LPC系数,分别获取区域索引Choosen_cluster(i)、第一级矢量量化VQ的索引VQ(j)和第二级分裂矢量量化SVQ的索引SVQ[5]对待量化的ISF[16]系数进行量化,得到量化后的ISF_q[16],进一步得到当前帧量化后的LPC_q[16],将原始的LPC[16]系数通过功率谱计算公式得到对应的功率谱pf[128];将得到的当前帧量化后的LPC_q[16]系数和原始LPC[16]系数对应的功率谱pf[128]计算出当前区域对应的谱失真SD,并与上一个区域的谱失真进行比较,获取最小的谱失真SD,将最小谱失真对应的区域索引Choosen_cluster(i)和第一级矢量量化后的索引VQ(j)以及第二级分裂矢量量化后的索引SVQ[5]输出,完成ISF系数矢量量化。本发明仅使用42bit量化16阶ISF系数,相比AMR‑WB+的46bit,少了4bit。

Patent Agency Ranking