语音关键词检出系统、创建用于其的词典的系统和方法

    公开(公告)号:CN102915729A

    公开(公告)日:2013-02-06

    申请号:CN201110217287.X

    申请日:2011-08-01

    Abstract: 本申请涉及语音关键词检出系统。其包括:输入单元,用于接收输入语音信号;特征提取单元,用于从输入语音信号提取至少一个特征;分类器单元,用于基于至少一个特征和词典将输入语音信号分类为目标关键词或者集外词;和输出单元,用于输出分类的结果。该词典包括:语法,包括目标关键词列表和用于集外词的两个标识符的至少一个序列;和词库,包括代表目标关键词列表中的一个或更多个目标关键词的音子序列的所有候选关键词的发音以及代表所述至少一个序列的发音,其中一个标识符表示第一类音子,另一个标识符表示第二类音子。第一类音子和第二类音子是基于音子的固有特征聚类的。第一类音子、第二类音子和目标关键词的音子由模型描述。

    语音关键词检出系统、创建用于其的词典的系统和方法

    公开(公告)号:CN102915729B

    公开(公告)日:2014-11-26

    申请号:CN201110217287.X

    申请日:2011-08-01

    Abstract: 本申请涉及语音关键词检出系统。其包括:输入单元,用于接收输入语音信号;特征提取单元,用于从输入语音信号提取至少一个特征;分类器单元,用于基于至少一个特征和词典将输入语音信号分类为目标关键词或者集外词;和输出单元,用于输出分类的结果。该词典包括:语法,包括目标关键词列表和用于集外词的两个标识符的至少一个序列;和词库,包括代表目标关键词列表中的一个或更多个目标关键词的音子序列的所有候选关键词的发音以及代表所述至少一个序列的发音,其中一个标识符表示第一类音子,另一个标识符表示第二类音子。第一类音子和第二类音子是基于音子的固有特征聚类的。第一类音子、第二类音子和目标关键词的音子由模型描述。

    词典压缩和词处理方法及系统、文语转换系统、电子设备

    公开(公告)号:CN102033859A

    公开(公告)日:2011-04-27

    申请号:CN200910176368.2

    申请日:2009-09-28

    Inventor: 亓超 金浩 康恒

    Abstract: 本发明提供利用计算机压缩词典中的电子数据的方法,包括:输入待压缩词典,所述待压缩词典中存储有词与其发音;对于每个汉字,将出现次数最多的发音确定为默认发音,并且形成基于默认发音的第一字音映射表;对于每个多音汉字,将除默认发音之外的剩余发音确定为非默认发音,并且形成基于非默认发音的第二字音映射表;以及根据关于每个汉字与其发音的组合在第一或第二字音映射表中的索引或位置的信息,将该组合压缩为16比特编码,以形成包含具有16比特编码形式的信息的压缩词典,其中,所述16比特编码包括关于该汉字在第一或第二字音映射表中的索引的信息,以及关于该发音在第一或第二字音映射表中的索引的信息。

    词典压缩和词处理方法及系统、文语转换系统、电子设备

    公开(公告)号:CN102033859B

    公开(公告)日:2013-04-10

    申请号:CN200910176368.2

    申请日:2009-09-28

    Inventor: 亓超 金浩 康恒

    Abstract: 本发明提供利用计算机压缩词典中的电子数据的方法,包括:输入待压缩词典,所述待压缩词典中存储有词与其发音;对于每个汉字,将出现次数最多的发音确定为默认发音,并且形成基于默认发音的第一字音映射表;对于每个多音汉字,将除默认发音之外的剩余发音确定为非默认发音,并且形成基于非默认发音的第二字音映射表;以及根据关于每个汉字与其发音的组合在第一或第二字音映射表中的索引或位置的信息,将该组合压缩为16比特编码,以形成包含具有16比特编码形式的信息的压缩词典,其中,所述16比特编码包括关于该汉字在第一或第二字音映射表中的索引的信息,以及关于该发音在第一或第二字音映射表中的索引的信息。

Patent Agency Ranking