语音处理系统
    1.
    发明公开

    公开(公告)号:CN103578462A

    公开(公告)日:2014-02-12

    申请号:CN201310301682.5

    申请日:2013-07-18

    CPC classification number: G10L13/02 G10L13/10 G10L25/63

    Abstract: 一种文语转换方法,该方法包括:接收输入文本;将所述输入文本分割为声单元序列;利用声学模型将所述声单元序列转换为语音矢量序列,其中所述模型具有多个模型参数,模型参数描述将声单元与语音矢量相关联的概率分布;以及将所述语音矢量序列输出为音频,该方法还包括通过如下步骤确定所述模型参数的至少部分:从所述输入文本提取表达特征以形成在第一空间中构建的表达语言特征矢量;以及将所述表达语言特征矢量映射到在第二空间中构建的表达合成特征矢量。

    语音合成方法和语音合成装置

    公开(公告)号:CN1185619C

    公开(公告)日:2005-01-19

    申请号:CN02108049.6

    申请日:2002-03-26

    CPC classification number: G10L13/04 G10L25/27

    Abstract: 一种语音合成方法,包括:根据音高模式、音位时长、音位符号串从共振峰参数中选择预定的共振峰参数;基于所选择的共振峰参数的共振峰频率和共振峰相位生成多个正弦波波形;将正弦波波形分别乘以所选择的共振峰参数的窗函数以生成多个共振峰波形;叠加共振峰波形以生成多个音高波形;以及根据音高周期抑制音高波形以生成语音信号。

    书籍朗读电子机器,编辑系统,存储媒体,及信息提供系统

    公开(公告)号:CN1300018A

    公开(公告)日:2001-06-20

    申请号:CN00128501.7

    申请日:2000-09-30

    CPC classification number: G10L13/00

    Abstract: 本发明提供一种与阅读纸上铅字的情形一样可以方便使用的书籍朗读电子机器,一种安装了可自由装卸的存储了铅字型书籍数据的卡型记录媒体的半导体存储媒体卡的电子机器,具有:以上述半导体存储媒体卡中的书籍数据为基础进行声音合成的声音合成部;取出在上述声音合成部得到的合成声音的合成声音取出部。这里,声音合成实现了用中间语言数据S的优质声音合成。而且,还有进行铅字显示的书籍数据显示部,与上述合成声音的取出同步,在上述书籍数据显示部进行上述书籍数据的铅字显示。

    对话系统、对话装置、对话方法以及存储介质

    公开(公告)号:CN111159364B

    公开(公告)日:2023-10-03

    申请号:CN201910811007.4

    申请日:2019-08-30

    Abstract: 本发明涉及对话系统、对话装置、对话方法及存储介质。提供当在用户的提问中包含未知的关键词时也能输出与用户的交互继续的响应的对话系统、对话装置、对话方法及存储介质。一个实施方式的对话系统具备知识参照部、未知关键词检测部、关联关键词推测部及响应生成部。知识参照部通过利用输入句的解析结果参照提问响应知识,得到针对输入句的回答的候补。未知关键词检测部从输入句检测未知关键词。关联关键词推测部响应于检测到未知关键词,从预定的关键词获取具有与未知关键词接近的意思的关联关键词的候补。响应生成部在未检测到未知关键词时根据回答的候补生成针对输入句的响应,在检测到未知关键词时根据关联关键词的候补生成针对输入句的响应。

    文本到语音的方法和系统

    公开(公告)号:CN103310784A

    公开(公告)日:2013-09-18

    申请号:CN201310081220.7

    申请日:2013-03-14

    CPC classification number: G10L15/26 G10L13/033 G10L13/08 G10L2021/0135

    Abstract: 一种文本到语音的方法,用于模拟多个不同的声音特性,包括:输入文本;将所输入的文本划分成声学单元序列;选择用于所输入的文本的声音特性;使用声学模型,将声学单元序列转换成语音向量序列,其中模型具有多个模型参数,其描述将声学单元与语音向量有关的概率分布;输出语音向量序列,作为具有所选择的声音特性的音频;其中,在所选择的声音特性中每个概率分布的预定类型的参数被表示为相同类型的参数的加权和,其中,所使用的权重是依赖声音特性的,以使得将声学单元序列转换成语音向量序列包括获取用于所选择的声音特性的声音特性依赖权重,其中,参数在聚类中提供,每个聚类包括至少一个子聚类,其中对于每个聚类,获取声音特性依赖权重,以使得每个子聚类有一个权重。

    韵律图样产生装置、语音合成装置及其方法

    公开(公告)号:CN101276584A

    公开(公告)日:2008-10-01

    申请号:CN200810086934.6

    申请日:2008-03-28

    CPC classification number: G10L13/10

    Abstract: 本发明涉及韵律图样产生装置、语音合成装置及其方法,通过计算初始韵律图样和语音文集的训练句子的韵律图样的平均值和标准偏差在归一化参数产生单元产生归一化参数。然后根据所述归一化参数在韵律图样归一化单元对初始韵律图样的变化范围或变化宽度进行归一。结果,使用很小的计算量可以产生接近于人类语音的、自然度提高的韵律图样。

    文本到语音的方法和系统

    公开(公告)号:CN103310784B

    公开(公告)日:2015-11-04

    申请号:CN201310081220.7

    申请日:2013-03-14

    CPC classification number: G10L15/26 G10L13/033 G10L13/08 G10L2021/0135

    Abstract: 一种文本到语音的方法,用于模拟多个不同的声音特性,包括:输入文本;将所输入的文本划分成声学单元序列;选择用于所输入的文本的声音特性;使用声学模型,将声学单元序列转换成语音向量序列,其中模型具有多个模型参数,其描述将声学单元与语音向量有关的概率分布;输出语音向量序列,作为具有所选择的声音特性的音频;其中,在所选择的声音特性中每个概率分布的预定类型的参数被表示为相同类型的参数的加权和,其中,所使用的权重是依赖声音特性的,以使得将声学单元序列转换成语音向量序列包括获取用于所选择的声音特性的声音特性依赖权重,其中,参数在聚类中提供,每个聚类包括至少一个子聚类,其中对于每个聚类,获取声音特性依赖权重,以使得每个子聚类有一个权重。

    文本到语音的系统
    9.
    发明公开

    公开(公告)号:CN103366733A

    公开(公告)日:2013-10-23

    申请号:CN201310110148.6

    申请日:2013-04-01

    CPC classification number: G10L13/08 G10L13/033 G10L2021/0135

    Abstract: 一种文本到语音的方法,其被配置为输出具有所选择的说话者声音和所选择的说话者属性的语音,该方法包括:输入文本;将所输入的文本划分成声学单元序列;选择用于所输入的文本的说话者;选择用于所输入的文本的说话者属性;使用声学模型,将声学单元序列转换成语音向量序列;输出语音向量序列,作为具有所选择的说话者声音和所选择的说话者属性的音频,其中,所述声学模型包括与说话者声音有关的第一组参数和与说话者属性有关的第二组参数,第一组和第二组参数没有重叠,选择说话者声音包括从第一组参数中选择给出说话者声音的参数,选择说话者属性包括从第二组参数中选择给出所选择的说话者属性的参数。

Patent Agency Ranking