声音判断装置、声音检测装置以及声音判断方法

    公开(公告)号:CN101601088A

    公开(公告)日:2009-12-09

    申请号:CN200880004020.9

    申请日:2008-08-25

    CPC classification number: G10L21/0208 G10L2025/783 G10L2025/937

    Abstract: 噪声除去装置(100)包括:FFT分析部(2402),接受包含抽出音和噪声的混合音,并针对规定的时间宽度中所包含的多个时刻的每一个来求所述混合音的频率信号;以及抽出音判断部(101(j)),针对所述规定的时间宽度中所包含的多个时刻的所述频率信号,将由第一阈值以上的数量构成的、且频率信号之间的相位距离在第二阈值以下的频率信号的每一个,判断为所述抽出音的频率信号;所述相位距离是,在将时刻t的频率信号的相位设为ψ(t)时,以ψ′(t)=mod2π(ψ(t)-2πft)来表示相位时的频率信号的相位间距离,相位的单位为弧度,f为分析频率。

    声源位置检测装置
    32.
    发明公开

    公开(公告)号:CN101512374A

    公开(公告)日:2009-08-19

    申请号:CN200780032157.0

    申请日:2007-11-06

    Abstract: 本发明提供一种可以检测抽取声的声源位置的声源位置检测装置,其具有:至少两个麦克风;对含有分别输入到两个麦克风的噪声的混合声进行频率分析,输出频率信号的分析部(103);以及抽取部(105),其生成多个包含在混合声中的抽取声的声源候补位置,按照声源候补位置对对应于两个麦克风的频率信号的时间轴进行调整以使从该声源候补位置到两个麦克风的混合声的时间差为零,求出表示时间轴调整后的对应于两个麦克风的频率信号中两个麦克风间的频率信号的差异程度的差分距离在阈值以下的频率信号,根据所求出的频率信号中对应于两个麦克风的频率信号彼此的一致程度,从声源候补位置中抽取抽取声的声源位置。

    语音识别装置及语音识别方法

    公开(公告)号:CN100495535C

    公开(公告)日:2009-06-03

    申请号:CN200480000433.1

    申请日:2004-02-04

    Abstract: 本发明的语音识别装置(1)包括:无用信息声音模型保存部(110),预先保存从无用词的集合学习到的声音模型——无用信息声音模型;特征量计算部(101),对每个声音分析的单位——帧的包含非语言声音的未知输入语音进行声音分析,计算识别所需的特征参数;无用信息声音得分计算部(111),对每个帧对照特征参数和无用信息声音模型,计算无用信息声音得分;无用信息声音得分校正部(113),对输入了非语言声音的帧进行校正以提高无用信息声音得分计算部(111)算出的无用信息声音得分;以及识别结果输出部(105),将语言得分、单词声音得分、以及无用信息声音得分校正机构校正过的无用信息声音得分的累计得分最高的单词串作为未知输入语音的识别结果来输出。

    对象声音分析装置、对象声音分析方法及对象声音分析程序

    公开(公告)号:CN101213589A

    公开(公告)日:2008-07-02

    申请号:CN200680023615.X

    申请日:2006-12-21

    CPC classification number: G10L25/48 G08G1/017 G10L21/028 G10L25/90

    Abstract: 一种对象声音分析装置,对具有与对象声音相同的基本周期且不同于对象声音的声音和对象声音进行区分,能够分析包含在评价声音中的对象声音,该对象声音分析装置分析在评价声音(S100)中是否包含对象声音(S101),具备:对象声音准备部(102),准备为了分析基本周期而使用的分析波形、即对象声音(S101);评价声音准备部(102),准备被分析基本周期的被分析波形、即评价声音(S100);分析部(104),将上述对象声音(S101)相对于上述评价声音(S100)进行时移的同时,依次计算对应的时刻的上述评价声音(S100)和上述对象声音(S101)的差分值,计算该差分值成为预定阈值(S104)以下的时刻的重复间隔,基于该重复间隔的周期和上述对象声音(S101)的基本周期,判断在上述评价声音(S100)中是否存在上述对象声音(S101)。

Patent Agency Ranking