-
公开(公告)号:CN110189767A
公开(公告)日:2019-08-30
申请号:CN201910360975.8
申请日:2019-04-30
Applicant: 上海大学
Abstract: 本发明公开了一种基于双声道音频的录制移动设备检测方法及装置,其中方法,包括以下步骤:获取双声道语料,对双声道语料进行傅里叶变换,提取频谱参数,计算得到幅度谱参数;根据幅度谱参数构造特征向量;根据特征向量,使用分类器对特征向量进行学习和分类。本发明的一种基于双声道音频的录制移动设备检测方法,利用一个含有大量手机录制音频的数据库,提取双声道音频的频谱特征并进行构造适用于双声道的特征向量,选择分类器学习,最终实现双声道设备的分类。
-
公开(公告)号:CN110189767B
公开(公告)日:2022-05-03
申请号:CN201910360975.8
申请日:2019-04-30
Applicant: 上海大学
Abstract: 本发明公开了一种基于双声道音频的录制移动设备检测方法及装置,其中方法,包括以下步骤:获取双声道语料,对双声道语料进行傅里叶变换,提取频谱参数,计算得到幅度谱参数;根据幅度谱参数构造特征向量;根据特征向量,使用分类器对特征向量进行学习和分类。本发明的一种基于双声道音频的录制移动设备检测方法,利用一个含有大量手机录制音频的数据库,提取双声道音频的频谱特征并进行构造适用于双声道的特征向量,选择分类器学习,最终实现双声道设备的分类。
-
公开(公告)号:CN110164468A
公开(公告)日:2019-08-23
申请号:CN201910338720.1
申请日:2019-04-25
Applicant: 上海大学
IPC: G10L21/0216 , G10L21/0232 , G10L21/0264
Abstract: 本发明公开了一种基于双麦克风的语音增强方法及装置,其中,方法包括以下步骤:根据双麦克风采集到的观测信号进行语音活动性检测和时延估计;根据语音活动性检测和时延估计的结果,进行基于频域独立成分分析的分离,计算二值掩模;根据计算的二值掩模,进行次序置信度的判决,输出分离后的语音与噪声;根据分离后的语音与噪声,进行似然比的计算;根据分离后的语音和似然比,进行滤波处理,得到增强后的语音信号。本发明的一种基于双麦克风的语音增强方法及装置,仅采用了双麦克风,大大降低了硬件成本的同时,在面对无方向性的噪声、与语音同向的噪声的情况下,依旧保持着优秀的语音增强性能。
-
公开(公告)号:CN110164465A
公开(公告)日:2019-08-23
申请号:CN201910406078.6
申请日:2019-05-15
Applicant: 上海大学
Abstract: 本发明公开了一种基于深层循环神经网络的语音增强方法,包括:获取语音数据集,对语音数据集进行预处理;对预处理后的语音数据集,进行字典训练,得到字典矩阵;根据字典矩阵,建立基于深层循环神经网络的模型;根据基于深层循环神经网络的模型,对基于深层循环神经网络的模型进行训练;使用训练好的基于深层循环神经网络的模型,对含噪声的语音信号进行语音增强处理,得到增强后的语音数据。本发明的一种基于深层循环神经网络的语音增强方法,使用更有效的方法提取语音特征,同时结合传统的非负矩阵分解(NMF)算法和深度学习的方法,实现了利用少量已有数据训练模型,并取得了有竞争力的语音增强效果。
-
公开(公告)号:CN103268307A
公开(公告)日:2013-08-28
申请号:CN201310005671.2
申请日:2013-01-08
Applicant: 上海大学
IPC: G06F17/10
Abstract: 本发明涉及一种对数分段线性逼近的图形处理方法。本方法操作步骤如下:根据对数分段线性逼近的原理,找出xi和xi+1,,xi+1分别为每个分段区间的首端点和末端点,然后计算出ai和di,ai表示每个区间分段直线逼近程度的控制参数,构成查找表LUT。将x作为查找表的输入,x为图形处理系统中的乘法、除法和指数运算的运算算子,x和每个区间的端点,xi+1进行比较,找出x所在的区间,查找出对应区间的4个参数p、q、r、d,p、q、r表示x所要进行的移位位数。根据得到的参数,对输入参数x进行移位操作,分别移位p、q、r,将得到的移位结果分别表示为x1’,x2’,x3’。将,x1’,x2’,x3’和d进行相加,相加结果为s。本发明采用相对误差控制指导对数分段的方法可降低对数变换的误差,使得此图形处理方法的计算精度大大增加。
-
公开(公告)号:CN102566965A
公开(公告)日:2012-07-11
申请号:CN201110433754.2
申请日:2011-12-22
Applicant: 上海大学
IPC: G06F7/483
Abstract: 本发明公开了一种误差平坦的浮点数对数运算装置,浮点数以2为底的对数运算,该浮点数值为,其中,S为浮点数的符号数,E为浮点数的指数,且E为L位比特数,F为浮点数的尾数,,该装置包括:比较器1;存储器2,与比较器连接;第一移位器31,与第一加法器41连接;第二移位器32,与第一加法器41连接;第三移位器33,与第二加法器42连接;第一加法器41,与第三加法器43连接;第二加法器42,与第三加法器43连接;第三加法器43,与第四加法器43连接;第四加法器44,与组合电路7连接;减法器5,与组合电路7连接;反相器6,与组合电路7连接;组合电路7。该装置计算量小,复杂度低,对数运算结果精确度高,且误差平坦。
-
公开(公告)号:CN106411487A
公开(公告)日:2017-02-15
申请号:CN201610131076.7
申请日:2016-03-08
Applicant: 上海大学
CPC classification number: Y02D70/00 , H04L5/0076 , H04W72/0453 , H04W72/0473
Abstract: 本发明涉及一种基站额定功率固定的下行OFDMA系统的高能效资源分配方法。该分配方法包括最优的子载波分配算法和最优功率分配算法。在进行子载波分配时,基站发射出来的每没个子载波分配给信道最强的用户。在最佳功率分配算法中,利用注水算法和二分法找到最佳的基站总功率。本发明方法对大功率OFDM信号发射基站的能源节约效果十分明显,并且具有低复杂度的特点。
-
公开(公告)号:CN104571492A
公开(公告)日:2015-04-29
申请号:CN201410530195.0
申请日:2014-10-10
Applicant: 上海大学
IPC: G06F3/01
CPC classification number: G06F3/01 , G06F2203/012
Abstract: 本发明涉及一种虚拟现实声渲染中球面声源表面的位置分布方法,该方法步骤如下:(1)将球面分为上、下半球面,上半球面分为不同的圆环,圆环分为若干个相等单元块;(2)然后通过Lambert映射投影到二维平面圆盘上,单元块坐标由 变为;(3)将圆盘分为若干个面积相等的单元块;(4)计算圆盘上的单元块的纵横比与半球面上单元块的纵横比;(5)递归地计算出半球面圆环的仰角的;(6)计算球面上单元块的水平角,获得半球面上所有单元块的位置分布;(7)计算出球面上所有单元块的位置分布。由于采用了上述的球面声源表面的位置分布方法,使得仰角几乎完全收敛于,从而使得声源的全向性得到保证,并表现为虚拟现实声的真实性得到保证。
-
公开(公告)号:CN106707239B
公开(公告)日:2019-06-04
申请号:CN201611217488.9
申请日:2016-12-26
Applicant: 上海大学
IPC: G01S5/22
Abstract: 本发明涉及一种基于概率分布的麦克风阵列角度估计后置滤波器设计方法,本方法的操作步骤如下:对参考角度进行粗估计,统计分析角度粗估计值并绘制直方图。对直方图进行拟合,得出当前环境下角度分布的概率密度函数。对当前环境下的待估计声源进行角度粗估计后,利用概率密度函数对角度数组进行滤波处理。查找滤波后混合概率密度函数曲线的最大值,并以此最大值的横坐标作为一次角度估计的结果。本方法可应用于利用时延差进行角度估计的场景中,使声源角度估计结果的稳定性和精度大大提升。
-
公开(公告)号:CN109215674A
公开(公告)日:2019-01-15
申请号:CN201810908839.3
申请日:2018-08-10
Applicant: 上海大学
IPC: G10L21/0208 , G10L21/0216 , G10L25/30 , G06N3/04 , G06N3/08
Abstract: 本发明涉及一种通用的实时语音增强方法,具体方法包括以下步骤:系统接收包含语音和多种环境干扰的含噪语音;使用多层的深度神经网络处理该含噪语音;系统输出增强的语音信号。使用深度神经网络处理含噪语音的过程具体包含以下部分:使用变换层提取变换域声学特征,特征中包括语音的幅度和相位信息;利用特征学习模块产生掩膜;利用产生的掩膜与含噪语音的变换域声学特征运算产生增强的语音的变换域声学特征;增强的语音的变换域声学特征经过反变换合成增强的语音波形。本发明采用有监督学习方法对含噪语音的幅度和相位同时进行语音增强处理;本发明提出的方法通过构建时域损失函数,利用沿时间展开的反向传播进行训练,克服了信号与声谱转换不一致问题。
-
-
-
-
-
-
-
-
-