一种基于级联混合高斯形状模型的多姿态图像特征点配准方法

    公开(公告)号:CN104537386B

    公开(公告)日:2019-04-19

    申请号:CN201410677256.6

    申请日:2014-11-21

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于级联混合高斯形状模型的多姿态图像特征点配准方法。该方法针对任意一种图像特征点定位器的定位结果,本发明中的配准方法能够显著提高其定位精度。本发明中所述的配准方法主要包括以下步骤:一、在多姿态的图像数据库上进行混合高斯形状模型的建模;二、采用一种级联的混合高斯形状模型对特征点进行校准,在每一级中,遍历特征点可能组成的形状,通过计算该形状对应的似然概率的阈值来判断出错误定位的特征点;三、采用正确特征点的高斯分布条件概率进行错误特征点的纠错。

    一种数字助听器的自适应验配方法

    公开(公告)号:CN106303874B

    公开(公告)日:2019-03-19

    申请号:CN201610974157.3

    申请日:2016-10-28

    Applicant: 东南大学

    Abstract: 本发明公开了一种数字助听器中自适应验配方法。传统的助听器验配过程离不开听力专家,验配的结果好坏直接取决于听力专家的专业水平,此外,对于发展中国家而言,相当一部分地区的医疗条件达不到验配标准,利用本方法可以有效地实现助听器的自适应验配,即脱离验配专家的助听器验配过程。本发明以二维高斯分布的求和形式作为验配模型,以交互式进化计算作为寻优方法,结合本发明设计的人机交互接口,通过30代以内的人机交互即可确定数字助听器的验配模型。实验结果表明,本发明提出的方法可以有效地实现数字助听器的自适应验配,摆脱了听力专家对于数字助听器验配过程的限制。

    一种研究生英语口语教学语音自动评估平台的实现方法

    公开(公告)号:CN109271482A

    公开(公告)日:2019-01-25

    申请号:CN201811030689.7

    申请日:2018-09-05

    Applicant: 东南大学

    Abstract: 本发明公开了一种研究生英语口语教学语音自动评估平台的实现方法,该平台适用于研究生ESP口语教学,在线国际会议英语口语教学系统平台中进行关键词的网络语音识别和口语表达自动评估。所述方法包括以下步骤:(1)建立ESP专门语料库;(2)建立用户语音识别特征信息库;(3)构建国际会议口语教学语音自动评估和实现的算法模型;(4)特征信息分析处理和实现“关键词”检索与识别的挖掘与途径。本发明改变教学模式,结合人工智能进行评估,以适应兼容国际化的需求,且涵盖了英语的语法、句法和语境三个方面的评估要素,具有实际意义和提高英语口语的教学和评估能力。

    一种用于语音情感识别的自学习语谱图特征提取方法

    公开(公告)号:CN105047194B

    公开(公告)日:2018-08-28

    申请号:CN201510450338.1

    申请日:2015-07-28

    Applicant: 东南大学

    Abstract: 本发明公开了一种用于语音情感识别的自学习语谱图特征提取方法,首先对已知情感的标准语料库中的语音进行预处理,得到量化后的语谱图灰度图像;然后计算所得到的语谱图灰度图像的Gabor语谱图;再采用可辨别特征学习算法对提取到的LBP统计直方图进行训练,构建不同尺度、不同方向下的全局显著性模式集合;最后采用全局显著性集合对语音不同尺度、不同方向下Gabor图谱的LBP统计直方图进行特征选择,得到处理后的统计直方图,将N个统计直方图级联,得到适合情感分类的语音情感特征。本发明提出的情感特征可以较好地识别不同种类的情感,识别率显著优于现有的声学特征。

    基于说话人模型对齐的非对称语音库条件下的语音转换方法

    公开(公告)号:CN104217721B

    公开(公告)日:2017-03-08

    申请号:CN201410399475.2

    申请日:2014-08-14

    Applicant: 东南大学

    Inventor: 宋鹏 赵力 金赟

    Abstract: 本发明提出了一种基于说话人模型对齐的非对称语音库条件下的语音转换方法,首先由源说话人和目标说话人的频谱特征分别训练得到各自的说话人模型,然后利用说话人模型中的参数找到源说话人特征向量和辅助向量之间的转换函数、辅助向量和目标说话人特征向量之间的转换函数,最后利用这两个转换函数求得源说话人和目标说话人之间的转换函数;在语音转换的过程中,使用了说话人模型对齐的方法,并且为了进一步提升语音转换的效果,还采用了将说话人模型对齐与高斯混合模型相融合的方法。实验结果表明:本发明在频谱失真度和相关度、转换语音的质量和相似度上,都取得了比传统基于INCA的语音转换方法更好的效果。

    基于布里渊放大多波长激光器的微波信号产生的方法与装置

    公开(公告)号:CN104269732B

    公开(公告)日:2017-02-15

    申请号:CN201410578188.8

    申请日:2014-10-24

    Applicant: 东南大学

    Inventor: 王如刚 赵力 周锋

    Abstract: 本发明公开一种基于布里渊放大多波长激光器的微波信号产生的方法与装置,所述装置由多波长激光器单元、滤波器、耦合器、光电探测器等组成。多波长激光器单元包括激光器单元、耦合器单元、放大器单元、环形器单元、光纤单元、偏振控制器单元和隔离器单元。本发明设计出的微波信号的装置与方法不仅能够产生高频微波信号,而且能够获得多带宽可调谐微波信号;本发明装置不需要电子器件,大大降低了电磁干扰等,且具有成本低廉、结构简单的优点。

    一种基于情感数据场的连续语音情感预测方法

    公开(公告)号:CN104050963B

    公开(公告)日:2017-02-15

    申请号:CN201410283309.6

    申请日:2014-06-23

    Applicant: 东南大学

    Inventor: 查诚 黄程韦 赵力

    Abstract: 本发明公开了一种基于情感数据场的连续语音情感预测算法,首先根据数据场理论,利用情感数据场中势函数建立不同语音情感特征向量之间的联系;其次,在短时间上选取多个语音情感特征向量,用群体智能算法在情感数据场中研究各语音情感特征向量的变化趋势,将这种变化趋势作为语音情感的识别结果。实验表明,本发明的方法可以有效的解决语音情感识别中存在的情感跟踪延迟问题并有效预测说话人情感的变化。

    一种基于MRMR准则的语音情感识别特征融合方法

    公开(公告)号:CN106205636A

    公开(公告)日:2016-12-07

    申请号:CN201610533439.X

    申请日:2016-07-07

    Applicant: 东南大学

    CPC classification number: G10L25/63

    Abstract: 本发明公开了一种基于MRMR准则的语音情感识别特征融合方法,包括如下步骤:1、提取语音信号的韵律特征、音质特征和谱特征;2、对提取的韵律特征、音质特征和谱特征采用MRMR准则进行特征融合。本发明公开的语音情感识别特征融合方法融合了语音的韵律特征、音质特征和谱特征,在保证识别率的同时有效优化了特征向量维度,提高了语音情感识别系统的效率。

    一种基于核半监督判别分析的语音情感识别方法

    公开(公告)号:CN103544963B

    公开(公告)日:2016-09-07

    申请号:CN201310549224.3

    申请日:2013-11-07

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于核半监督判别分析的语音情感识别方法,对经预处理的语音样本中语音情感特征提取后,进行特征筛选、KSDA维数约简和分类。在训练阶段,对全监督训练样本集使用KSDA进行维数约简,将表示训练样本不同关系信息的嵌入图结合起来,并使用核化数据映射,实现对语音情感特征维数约简的优化,再用低维样本训练多类SVM分类器;在测试阶段,依次使用训练阶段特征筛选得到的特征及维数约简得到的数据映射方式,对各测试样本获取其低维特征,再使用训练得到的分类器进行分类判决,得到测试样本的类别。与现有方法相比,本发明的方法在语音情感特征维数约简中增加了降维的有效性,使语音情感识别系统的识别率性能得到了提升。

    一种自适应的听力补偿方法

    公开(公告)号:CN105307093A

    公开(公告)日:2016-02-03

    申请号:CN201510835800.X

    申请日:2015-11-26

    Applicant: 东南大学

    Abstract: 本发明公开了一种自适应的听力补偿方法,本发明包括以下步骤:首先利用gammatone滤波器组对输入信号进行多通道分解,然后根据通道内信号的动态范围以及听损患者的听觉范围确定补偿方法,若通道信号经线性增益处理后仍在患者的听觉范围内则使用线性放大进行听力补偿以减小畸变,否则使用动态范围压缩进行补偿以增加可听度。另外,为减小动态范围压缩带来的信号畸变,提高噪声环境下输出信号的信噪比,采用自适应压缩方法进行听力补偿,使压缩比尽量接近于1。本发明相比已有的听力补偿方法,本发明补偿后的语音可懂度更高,具有很强的实用性。

Patent Agency Ranking