-
公开(公告)号:CN103761969B
公开(公告)日:2016-09-14
申请号:CN201410057260.2
申请日:2014-02-20
Applicant: 武汉大学
IPC: G10L19/04
Abstract: 本发明公开了一种基于高斯混合模型的感知域音频编码方法和系统,包括步骤:步骤1,采用听觉滤波器对输入音频信号进行滤波,获得子带信号;步骤2,提取子带信号的希尔伯特包络,对希尔伯特包络进行平滑滤波,获得子带信号谱包络;步骤3,采用心理声学模型获得子带信号谱包络的绝对掩蔽阈值,根据绝对掩蔽阈值对子带信号谱包络进行听觉阈值判别;步骤4,采用多路复用掩蔽模型替换子带信号谱包络;步骤5,采用采用高斯‑牛顿算法对子带信号谱包络进行高斯混合模型参数拟合;步骤6,量化和编码拟合后的高斯混合模型参数。本发明可应用于高质量的中低码率语音编码,能大大降低编码码率。
-
公开(公告)号:CN104658542A
公开(公告)日:2015-05-27
申请号:CN201510113860.0
申请日:2015-03-16
Applicant: 武汉大学
IPC: G10L19/018
Abstract: 本发明公开了一种基于正交的加性扩频音频水印嵌入方法、检测方法及系统,主要包括:步骤1,时域音频信号的时频变换;步骤2,根计算频域音频信号可嵌入水印的范围;步骤3,生成随机的二进制扩频序列;步骤4,将二进制扩频序列和可嵌入水印的范围内的频域音频信号进行正交处理;步骤5,根据正交处理后的向量进行水印的加性嵌入;步骤6,带水印频域音频信号的时频逆变换。本发明将主音频信号和扩频信号进行正交,然后在扩频信号垂直分量上实现水印的加性嵌入,这样保证了相关提取时主信号对水印的干扰为零,从而可消除主信号干扰,大大降低水印提取错误率。
-
公开(公告)号:CN103400582A
公开(公告)日:2013-11-20
申请号:CN201310351242.0
申请日:2013-08-13
Applicant: 武汉大学
IPC: G10L19/008
Abstract: 本发明公开了一种面向多声道三维音频的编解码方法与系统,包括时频变换模块、子带划分模块、子带能量计算模块、变换模块,子带能量还原模块、子带合成模块和频时变换模块。编码端,将输入声道的时域信号变换为频域信号,并将各声道的频域信号信号划分为子带,计算各子带能量;将相邻三个声道对应的子带能量组合成声道单元,分析声道单元中各子带能量并根据分析结果选择变换矩阵;在解码端,通过变换矩阵索引,还原声道单元,并获得各声道的频域信号,通过频时变换得到各声道的域信号,从而最大无失真地完成了原始声道信号的还原。本发明可实现声道间冗余信息的去除,且具有低复杂度和高效率的特点,适用于三维音频直播通信传输的要求。
-
公开(公告)号:CN104320719B
公开(公告)日:2018-09-07
申请号:CN201410647192.5
申请日:2014-11-14
Applicant: 武汉大学
IPC: H04N21/8358 , H04N21/439 , H04N21/81
Abstract: 本发明公开了一种基于音频水印的电视节目互动参与方法及系统,包括:(1)嵌入步骤,即向电视节目音频信号嵌入包含互动信息的水印信号;(2)播放步骤,即利用播放装置(电视机或播放器)播放嵌入水印信号的电视节目;(3)录音步骤,即使用移动终端设备录下播放的嵌入水印信号的电视节目音频信号;(4)提取步骤,即利用移动终端设备从嵌入水印信号的电视节目音频信号中提取水印信号,只要采用移动终端打开网络即可立即参与电视节目互动。本发明方便快捷,并且不影响观众对电视节目的欣赏和观看。
-
公开(公告)号:CN103400582B
公开(公告)日:2015-09-16
申请号:CN201310351242.0
申请日:2013-08-13
Applicant: 武汉大学
IPC: G10L19/008
Abstract: 本发明公开了一种面向多声道三维音频的编解码方法与系统,包括时频变换模块、子带划分模块、子带能量计算模块、变换模块,子带能量还原模块、子带合成模块和频时变换模块。编码端,将输入声道的时域信号变换为频域信号,并将各声道的频域信号信号划分为子带,计算各子带能量;将相邻三个声道对应的子带能量组合成声道单元,分析声道单元中各子带能量并根据分析结果选择变换矩阵;在解码端,通过变换矩阵索引,还原声道单元,并获得各声道的频域信号,通过频时变换得到各声道的域信号,从而最大无失真地完成了原始声道信号的还原。本发明可实现声道间冗余信息的去除,且具有低复杂度和高效率的特点,适用于三维音频直播通信传输的要求。
-
公开(公告)号:CN104658542B
公开(公告)日:2018-01-12
申请号:CN201510113860.0
申请日:2015-03-16
Applicant: 武汉大学
IPC: G10L19/018
Abstract: 本发明公开了一种基于正交的加性扩频音频水印嵌入方法、检测方法及系统,主要包括:步骤1,时域音频信号的时频变换;步骤2,根计算频域音频信号可嵌入水印的范围;步骤3,生成随机的二进制扩频序列;步骤4,将二进制扩频序列和可嵌入水印的范围内的频域音频信号进行正交处理;步骤5,根据正交处理后的向量进行水印的加性嵌入;步骤6,带水印频域音频信号的时频逆变换。本发明将主音频信号和扩频信号进行正交,然后在扩频信号垂直分量上实现水印的加性嵌入,这样保证了相关提取时主信号对水印的干扰为零,从而可消除主信号干扰,大大降低水印提取错误率。
-
公开(公告)号:CN104320719A
公开(公告)日:2015-01-28
申请号:CN201410647192.5
申请日:2014-11-14
Applicant: 武汉大学
IPC: H04N21/8358 , H04N21/439 , H04N21/81
CPC classification number: H04N21/8358 , H04N21/4394 , H04N21/8106
Abstract: 本发明公开了一种基于音频水印的电视节目互动参与方法及系统,包括:(1)嵌入步骤,即向电视节目音频信号嵌入包含互动信息的水印信号;(2)播放步骤,即利用播放装置(电视机或播放器)播放嵌入水印信号的电视节目;(3)录音步骤,即使用移动终端设备录下播放的嵌入水印信号的电视节目音频信号;(4)提取步骤,即利用移动终端设备从嵌入水印信号的电视节目音频信号中提取水印信号,只要采用移动终端打开网络即可立即参与电视节目互动。本发明方便快捷,并且不影响观众对电视节目的欣赏和观看。
-
公开(公告)号:CN103761969A
公开(公告)日:2014-04-30
申请号:CN201410057260.2
申请日:2014-02-20
Applicant: 武汉大学
IPC: G10L19/04
Abstract: 本发明公开了一种基于高斯混合模型的感知域音频编码方法和系统,包括步骤:步骤1,采用听觉滤波器对输入音频信号进行滤波,获得子带信号;步骤2,提取子带信号的希尔伯特包络,对希尔伯特包络进行平滑滤波,获得子带信号谱包络;步骤3,采用心理声学模型获得子带信号谱包络的绝对掩蔽阈值,根据绝对掩蔽阈值对子带信号谱包络进听觉行阈值判别;步骤4,采用多路复用掩蔽模型替换子带信号谱包络;步骤5,采用采用高斯-牛顿算法对子带信号谱包络进行高斯混合模型参数拟合;步骤6,量化和编码拟合后的高斯混合模型参数。本发明可应用于高质量的中低码率语音编码,能大大降低编码码率。
-
-
-
-
-
-
-