用于簇集音素模型的装置、方法和程序

    公开(公告)号:CN101419798A

    公开(公告)日:2009-04-29

    申请号:CN200810174922.9

    申请日:2008-10-24

    Inventor: 酒井优

    CPC classification number: G10L15/063 G10L2015/025 G10L2015/0631

    Abstract: 本发明涉及用于簇集音素模型的装置、方法和程序。节点初始化单元生成包括输入的音素模型的根节点。候选者生成单元通过将没有子节点的节点中包括的音素模型的集合划分成两个生成一对子集合的候选者。候选者删除单元删除每个只包括附带有指示所述子集合的至少一个具有少量语音数据用于训练的确定信息的音素模型的候选者。类似度计算单元计算在所述子集合中包括的所述音素模型之间的类似度的和。候选者选择单元选择具有最大和的候选者中的一个。节点生成单元分别生成两个包括所述两个包括在所述选择的候选者中的子集合的节点。簇集单元以每个包括在节点中的音素模型集合为单位来簇集所述音素模型。

    语音识别装置和方法
    2.
    发明公开

    公开(公告)号:CN101101751A

    公开(公告)日:2008-01-09

    申请号:CN200710127193.7

    申请日:2007-07-04

    CPC classification number: G10L15/142 G10L2015/085

    Abstract: 一种本发明的实施例包括:声音处理功能、语音区间检测功能、词典功能、对照功能、搜索对象选择功能、存储功能以及确定功能,并且包括以下处理:基于束搜索选择搜索范围,设置并存储基准帧,存储某一转移路径的输出概率,确定是否存储了某一路径的输出概率,从而通过以下操作减少了输出概率的计算次数:基于束搜索选择搜索范围,在从设置基准帧到更新基准帧的时间间隔中只计算一次某一转移路径的输出概率,存储所计算的值,并且当转移路径的输出概率存储在后续的帧中时,使用所存储的值作为输出概率的近似值。

    语音识别评价装置和语音识别评价方法

    公开(公告)号:CN1311422C

    公开(公告)日:2007-04-18

    申请号:CN200410103890.5

    申请日:2004-09-03

    CPC classification number: G10L15/01

    Abstract: 本发明提供一种不再需要预先准备评价用语音数据,可以容易地对语音识别装置相对每一评价项目的性能进行评价,并且可以用少的时间和少的成本实施评价的技术。评价项目设定部(11)取得评价语音识别装置用的评价项目,并依据该评价项目生成出确定输出至语音识别装置的合成声音特征的评价用语音信息。声音合成参数生成部(12)生成用来生成与评介用语音信息相对应的合成声音的参数。声音合成部(13)依据所述参数生成合成声音。合成声音输出部(14)将合成声音输出至语音识别装置。识别结果获取部(15)从语音识别装置取得语音识别装置输入合成声音并实施识别的识别结果。识别结果解析部(16)参照评价项目和识别结果,对语音识别装置相对该评价项目的性能进行评价。

    语音识别评价装置和语音识别评价方法

    公开(公告)号:CN1619643A

    公开(公告)日:2005-05-25

    申请号:CN200410103890.5

    申请日:2004-09-03

    CPC classification number: G10L15/01

    Abstract: 本发明提供一种不再需要预先准备评价用语音数据,可以容易地对语音识别装置相对每一评价项目的性能进行评价,并且可以用少的时间和少的成本实施评价的技术。评价项目设定部(11)取得评价语音识别装置用的评价项目,并依据该评价项目生成出确定输出至语音识别装置的合成声音特征的评价用语音信息。声音合成参数生成部(12)生成用来生成与评价用语音信息相对应的合成声音的参数。声音合成部(13)依据所述参数生成合成声音。合成声音输出部(14)将合成声音输出至语音识别装置。识别结果获取部(15)从语音识别装置取得语音识别装置输入合成声音并实施识别的识别结果。识别结果解析部(16)参照评价项目和识别结果,对语音识别装置相对该评价项目的性能进行评价。

    语音识别装置及其方法
    5.
    发明公开

    公开(公告)号:CN101369425A

    公开(公告)日:2009-02-18

    申请号:CN200810168616.4

    申请日:2008-08-15

    Inventor: 酒井优

    CPC classification number: G10L15/32 G10L15/142 G10L15/193

    Abstract: 一种语音识别装置包括:第一语法存储单元,其被配置为存储一个或多个语法片段;第二语法存储单元,其被配置为存储一个或多个语法片段;第一匹配单元,其被配置为通过参阅存储在第二语法存储单元中的语法片段,执行匹配处理;语法传输单元,其被配置为将后续语法片段从第一语法存储单元传输至第二语法存储单元;第二匹配单元,其被配置为与语法传输单元并行地进行操作并且通过参阅存储在第二语法存储单元中的语法片段,执行匹配处理;以及识别控制单元,其被配置为监视由语法传输单元执行的后续语法片段的传输的状态,并通过根据语法片段的传输的状态切换其操作来使两个匹配单元工作。

Patent Agency Ranking