-
公开(公告)号:CN101601088A
公开(公告)日:2009-12-09
申请号:CN200880004020.9
申请日:2008-08-25
Applicant: 松下电器产业株式会社
CPC classification number: G10L21/0208 , G10L2025/783 , G10L2025/937
Abstract: 噪声除去装置(100)包括:FFT分析部(2402),接受包含抽出音和噪声的混合音,并针对规定的时间宽度中所包含的多个时刻的每一个来求所述混合音的频率信号;以及抽出音判断部(101(j)),针对所述规定的时间宽度中所包含的多个时刻的所述频率信号,将由第一阈值以上的数量构成的、且频率信号之间的相位距离在第二阈值以下的频率信号的每一个,判断为所述抽出音的频率信号;所述相位距离是,在将时刻t的频率信号的相位设为ψ(t)时,以ψ′(t)=mod2π(ψ(t)-2πft)来表示相位时的频率信号的相位间距离,相位的单位为弧度,f为分析频率。
-
公开(公告)号:CN101512374A
公开(公告)日:2009-08-19
申请号:CN200780032157.0
申请日:2007-11-06
Applicant: 松下电器产业株式会社
CPC classification number: G01S3/8083 , G10L2021/02166 , H04R2201/403 , H04R2410/00
Abstract: 本发明提供一种可以检测抽取声的声源位置的声源位置检测装置,其具有:至少两个麦克风;对含有分别输入到两个麦克风的噪声的混合声进行频率分析,输出频率信号的分析部(103);以及抽取部(105),其生成多个包含在混合声中的抽取声的声源候补位置,按照声源候补位置对对应于两个麦克风的频率信号的时间轴进行调整以使从该声源候补位置到两个麦克风的混合声的时间差为零,求出表示时间轴调整后的对应于两个麦克风的频率信号中两个麦克风间的频率信号的差异程度的差分距离在阈值以下的频率信号,根据所求出的频率信号中对应于两个麦克风的频率信号彼此的一致程度,从声源候补位置中抽取抽取声的声源位置。
-
公开(公告)号:CN100495535C
公开(公告)日:2009-06-03
申请号:CN200480000433.1
申请日:2004-02-04
Applicant: 松下电器产业株式会社
IPC: G10L15/20
Abstract: 本发明的语音识别装置(1)包括:无用信息声音模型保存部(110),预先保存从无用词的集合学习到的声音模型——无用信息声音模型;特征量计算部(101),对每个声音分析的单位——帧的包含非语言声音的未知输入语音进行声音分析,计算识别所需的特征参数;无用信息声音得分计算部(111),对每个帧对照特征参数和无用信息声音模型,计算无用信息声音得分;无用信息声音得分校正部(113),对输入了非语言声音的帧进行校正以提高无用信息声音得分计算部(111)算出的无用信息声音得分;以及识别结果输出部(105),将语言得分、单词声音得分、以及无用信息声音得分校正机构校正过的无用信息声音得分的累计得分最高的单词串作为未知输入语音的识别结果来输出。
-
公开(公告)号:CN101213589A
公开(公告)日:2008-07-02
申请号:CN200680023615.X
申请日:2006-12-21
Applicant: 松下电器产业株式会社
CPC classification number: G10L25/48 , G08G1/017 , G10L21/028 , G10L25/90
Abstract: 一种对象声音分析装置,对具有与对象声音相同的基本周期且不同于对象声音的声音和对象声音进行区分,能够分析包含在评价声音中的对象声音,该对象声音分析装置分析在评价声音(S100)中是否包含对象声音(S101),具备:对象声音准备部(102),准备为了分析基本周期而使用的分析波形、即对象声音(S101);评价声音准备部(102),准备被分析基本周期的被分析波形、即评价声音(S100);分析部(104),将上述对象声音(S101)相对于上述评价声音(S100)进行时移的同时,依次计算对应的时刻的上述评价声音(S100)和上述对象声音(S101)的差分值,计算该差分值成为预定阈值(S104)以下的时刻的重复间隔,基于该重复间隔的周期和上述对象声音(S101)的基本周期,判断在上述评价声音(S100)中是否存在上述对象声音(S101)。
-
公开(公告)号:CN1561514A
公开(公告)日:2005-01-05
申请号:CN02819184.6
申请日:2002-09-27
Applicant: 松下电器产业株式会社
CPC classification number: H04N21/488 , G06F3/16 , G10L15/22 , H04N7/14 , H04N7/16 , H04N21/42203
Abstract: 为了即使在比较小规模的装置构成中,也难误辨识利用者的发音,从而顺利地进行对话,可以容易地给予接近自由对话的印象,图像输出部将被广播的图像等与视听者非对话性进行的图像显示在显示部上,对话处理部根据存储于对话数据库内的与上述图像的进展对应的对话数据,输出开始对话用的装置发话数据,同时若从视听者进行发话,则根据从声音辨识部输出的视听者发话数据与上述对话数据,输出用来应答视听者的发话的装置发话数据。
-
-
-
-