一种用于语音识别的Ngram模型改进方法

    公开(公告)号:CN102968989A

    公开(公告)日:2013-03-13

    申请号:CN201210528093.6

    申请日:2012-12-10

    Inventor: 柯登峰 徐波

    Abstract: 本发明公开了一种用于语音识别的Ngram模型改进方法,其包括:将用于语音识别的原始Ngram模型转成等价的WFSA网络NET1;利用RNN优化所述NET1,使得使用所述NET1对训练文本打分时,对于训练文本中每个语句的输出概率最大化;利用发音字典将所述NET1转成带有语言模型概率的WFST发音网络NET2;利用音子混淆矩阵优化所述发音网络NET2,使得句子错误率最小化;将所述发音网络NET2反向转换成改进后的Ngram模型,使用该改进后的Ngram模型进行语音识别。

    语音输入设备使用异常的检测方法及系统

    公开(公告)号:CN102324229B

    公开(公告)日:2012-11-28

    申请号:CN201110265473.0

    申请日:2011-09-08

    Abstract: 本发明公开了一种语音输入设备使用异常的检测方法及系统。本发明采用对远讲语音信号表征更全面、更趋近于人感知的特征提取方式,从而可以粗略的判断背景语音,正常语音和远讲语音。在音频信号分类的基础上,采用现代信号处理技术和统计机器学习理论相结合的方法,克服了传统方法对前端语音输入的诸多限制问题,使得信号级质量评分更趋近于人的评分。本发明解决了在大规模口语测试中,由于人为设备使用错误而导致的前端输入语音质量差异问题。

    测试英文口语韵律水平的方法

    公开(公告)号:CN102426834A

    公开(公告)日:2012-04-25

    申请号:CN201110252779.2

    申请日:2011-08-30

    Abstract: 本发明公开了一种测试英文口语韵律水平的方法。该方法包括:步骤A,对原始英语语音信号进行预处理;步骤B,在进行预处理后的原始英语语音信号中提取用于韵律测试的多知识源特征参数,该多知识源特征参数包括韵律表现特征、韵律产生特征和韵律影响特征;步骤C,由多数多知识源特征参数获取所述原始英语语音的韵律水平测试分数。本发明测试英文口语韵律水平的方法,以使用多知识源信息进行细化并融合的策略取得更佳的测试效果,提高测试的客观性和准确性。

    汉语作文自动测试方法及系统

    公开(公告)号:CN102279844A

    公开(公告)日:2011-12-14

    申请号:CN201110255852.1

    申请日:2011-08-31

    Abstract: 本发明公开了一种汉语作文自动测试方法及系统。该方法包括:步骤A:输入作文文本待评语料,对作文文本待评语料进行预处理;步骤B:通过主题内容模型、条理结构模型和语言表达特征模型对预处理后的作文文本待评语料提取主题内容特征、条理结构特征、语言表达特征;步骤C:对所提取的主题内容特征、条理结构特征、语言表达特征用评分方程进行计算,获得汉语作文的自动评分结果。本发明减少大规模汉语作文水平测试中的人力物力投入,并实现了评分的客观化。

    一种对语调进行评估的方法

    公开(公告)号:CN101727902B

    公开(公告)日:2011-08-10

    申请号:CN200810225405.X

    申请日:2008-10-29

    Abstract: 本发明公开了一种对语调进行评估的方法,该方法包括:对输入的语音进行基频提取,获得连续不断的基频曲线;对输入的语音进行对齐分割,获得声韵母边界,并对音高和时长进行规整化处理,获得规整音高曲线和规整时长曲线;将该规整音高曲线和规整时长曲线与标准音的规整音高曲线和规整时长曲线进行比较,计算出输入语音的音高和时长相对于标准音的误差值;将音高和时长的误差值分别进行排序,并抽取出有代表性的点,形成音高排序误差矢量和时长排序误差矢量;以音高排序误差矢量和时长排序误差矢量为特征对语调进行评估。利用本发明,解决了现有的计算机辅助语言教学技术中的语调评估问题。

    基于噪声更新因子的语音增强方法和装置

    公开(公告)号:CN116403594B

    公开(公告)日:2023-08-18

    申请号:CN202310671651.2

    申请日:2023-06-08

    Abstract: 本发明涉及一种基于噪声更新因子语音增强的方法和装置,该方法包括:获取带噪语音;对带噪语音进行傅里叶变换分解,得到带噪傅里叶系数;对带噪傅里叶系数进行特征提取,得到带噪Fbank特征;将带噪Fbank特征输入至预先训练的语音降噪模型,通过维纳滤波对带噪信号进行滤波,得到降噪后的目标语音信号的傅里叶系数;根据降噪后的目标语音傅里叶系数生成降噪后语音波形信号。本发明具有显著的性能提升,既能处理平稳噪声,又能应对非平稳噪声,生成的纯净语音质量较高,同时鲁棒性高,在各自声学场景中性能稳定,提升用户体验。

    一种声调评测方法
    18.
    发明公开

    公开(公告)号:CN102419973A

    公开(公告)日:2012-04-18

    申请号:CN201110370038.4

    申请日:2011-11-18

    Abstract: 本发明公开了一种声调评测方法。该方法包括:从待评测语音中提取声调识别特征,声调识别特征包含基频曲线特征;将声调识别特征送入训练后的声调识别模型,获得每一个声调的识别得分;提取得分最高的声调及其识别得分作为第一评测特征,标准声调和标准声调识别得分作为第二评测特征;将第一声调评测特征和第二声调评测特征合并成4维的声调评测特征,送入训练后的声调评测模型,获得待评测语音的声调评测得分。本发明声调评测方法可以获得更加良好的声调评测性能。

    一种对语调进行评估的方法

    公开(公告)号:CN101727902A

    公开(公告)日:2010-06-09

    申请号:CN200810225405.X

    申请日:2008-10-29

    Abstract: 本发明公开了一种对语调进行评估的方法,该方法包括:对输入的语音进行基频提取,获得连续不断的基频曲线;对输入的语音进行对齐分割,获得声韵母边界,并对音高和时长进行规整化处理,获得规整音高曲线和规整时长曲线;将该规整音高曲线和规整时长曲线与标准音的规整音高曲线和规整时长曲线进行比较,计算出输入语音的音高和时长相对于标准音的误差值;将音高和时长的误差值分别进行排序,并抽取出有代表性的点,形成音高排序误差矢量和时长排序误差矢量;以音高排序误差矢量和时长排序误差矢量为特征对语调进行评估。利用本发明,解决了现有的计算机辅助语言教学技术中的语调评估问题。

Patent Agency Ranking