-
公开(公告)号:CN1946985A
公开(公告)日:2007-04-11
申请号:CN200580011726.4
申请日:2005-04-19
Applicant: 松下电器产业株式会社
IPC: G01C21/00 , G08G1/0969 , H04S1/00 , H04S7/00
Abstract: 一种音频信息输出装置,其中,方位和距离计算部(107)根据从引导方信息接收存储部(106)获得的下一引导的交叉点的信息、和使用者(11)的移动历史信息,计算出到交叉点的相对方向和距离。并且,将相对方向转换成水平角,将该距离转换成仰角,且传送到立体声生成部(108)。立体声生成部(108)通过生成将声像定位在耳机的外侧的输出音频信息,并输出到耳机(101),由此,使用者能够确实把握到引导对象物的距离。
-
公开(公告)号:CN103380457A
公开(公告)日:2013-10-30
申请号:CN201280007609.0
申请日:2012-11-08
Applicant: 松下电器产业株式会社
Abstract: 一种声音处理装置,具有:特征生成部,按照每个单位区间生成表现声音信号的单位区间的特征的区间特征;变化值计算部,按照所述声音信号的每个单位区间,将该单位区间作为基点区间,使用所述基点区间附近的多个单位区间的所述区间特征,计算将所述声音信号的特征在所述基点区间中的时间变化进行定量化得到的特征变化值;以及区间判定部,根据所述特征变化值与阈值的比较结果,判定所述基点区间是否是包含所述声音信号的特征的变化点的特征单位区间。由此,声音处理装置从AV内容等的声音信号中检测包括声音特征的变化点的特征单位区间。
-
公开(公告)号:CN103053173A
公开(公告)日:2013-04-17
申请号:CN201280002327.1
申请日:2012-04-24
Applicant: 松下电器产业株式会社
IPC: H04N21/4728
CPC classification number: G11B27/031 , G10L25/87 , G11B27/28
Abstract: 一种兴趣区间确定装置,基于动态图像文件所包含的音频信号,在所述动态图像文件中确定被推测为用户表现出兴趣的用户的兴趣区间,具备:兴趣区间候选提取单元(1801),在所述动态图像文件中,提取成为所述兴趣区间的候选的兴趣区间候选;微细构造判定单元(1802),判定所述兴趣区间候选中是否包含有特定的微细构造;以及兴趣区间确定单元(1803),在由所述微细构造判定单元判定为包含有所述微细构造的情况下,对包含所述微细构造且比所述兴趣区间候选短的特定区间进行解析,确定兴趣区间。
-
公开(公告)号:CN102782750A
公开(公告)日:2012-11-14
申请号:CN201180012516.2
申请日:2011-10-28
Applicant: 松下电器产业株式会社
CPC classification number: H04N5/147 , G06F17/30787 , G10L25/81 , G10L99/00 , G11B27/034 , G11B27/28 , H04N21/4394 , H04N21/8456
Abstract: 一种兴趣区间抽取装置(104),根据动态图像文件中所包含的音频信号来抽取包括指定时刻(T0)的用户的兴趣区间,该兴趣区间抽取装置(104)具有:接口装置(109),取得指定时刻(T0);似然度向量生成部(202),对于音频信号的每个第1单位区间计算表现多种音素各自的特征的各个锚模型(Ar)的似然度,并生成以计算出的各个似然度为分量的似然度向量(F);以及兴趣区间抽取部(209),根据似然度向量(F)计算成为兴趣区间的候选的第1特征区间,并抽取包括指定时刻(T0)的第1特征区间的一部分区间作为兴趣区间。
-
公开(公告)号:CN102428716A
公开(公告)日:2012-04-25
申请号:CN201080021517.9
申请日:2010-06-16
Applicant: 松下电器产业株式会社
CPC classification number: H04R25/407 , G01S3/803 , H04R25/552 , H04R25/554 , H04R2225/43 , H04S2420/01
Abstract: 没有在语音识别精度上的降低,通过使用从多个麦克风输入的声音信号检测由除了会话对方之外的某人的呼叫和其他各种声音。助听器装置基于除了会话对方之外的某人的呼叫语音到来的方向,校正除了会话对方之外的某人的呼叫语音的频率特性,基于通过多个麦克风转换的声音信号来估计该方向。然后,基于通过使用具有一个特性的麦克风记录的其他语音数据,助听器装置将其频率特性已经被频率特性调整处理单元校正的、除了会话对方之外的某人的呼叫语音与用于表示音素和音节特征的呼叫词标准模式作比较。通过这个比较,该助听器装置确定除了会话对方之外的某人的呼叫语音是否是呼叫词。然后,基于呼叫词确定部件的确定结果,助听器装置相对于除了会话对方的语音到来的方向之外的方向形成定向。另外,该助听器装置校正除了会话对方之外的某人的呼叫语音的频率特性,使得该频率特性可以与在准备声音标准模式时的麦克风的特性相同。
-
公开(公告)号:CN1530926A
公开(公告)日:2004-09-22
申请号:CN200410030416.4
申请日:2004-03-15
Applicant: 松下电器产业株式会社
CPC classification number: G10L15/063 , G10L2015/0631
Abstract: 节目指南装置具备:识别字词储存部(105),用来存储过去识别字词,该过去识别字词是过去通过语音识别所识别出的字词;视听履历字词储存部(106),用来存储视听履历字词,该视听履历字词是所视听的节目信息;词典制作部(103),用来制作利用者自适应式识别词典和加权利用者自适应式识别词典,该利用者自适应式识别词典已在基本识别词典中添加基本识别词典中不存在的过去识别字词及视听履历字词,该加权利用者自适应式识别词典已按照「对象权重系数」及「履历权重系数」实行加权,该「对象权重系数」与字词的种类相应,该「履历权重系数」与是否作为过去识别字词及视听履历字词被存储相应。
-
公开(公告)号:CN102473409B
公开(公告)日:2014-04-23
申请号:CN201180002465.5
申请日:2011-04-19
Applicant: 松下电器产业株式会社
IPC: G10L25/57
CPC classification number: G10L25/57 , G10L2015/0631
Abstract: 本发明提供一种在利用AV流中的音频流来执行AV流的分类等的装置中,对执行该分类时所使用的声音空间基准模型进行在线自适应调节的装置以及其方法。该装置将所输入的音频流分割成具有相同声音特征的片段数据,并对所分割得到的片段数据的单一概率模型进行估计。其后,针对所估计的单一概率模型与到此为止所存储的其他的声音特征的单一概率模型执行聚类,来生成新的声音空间的基准模型。
-
公开(公告)号:CN102906790A
公开(公告)日:2013-01-30
申请号:CN201180025428.6
申请日:2011-04-15
Applicant: 松下电器产业株式会社
CPC classification number: G06K9/00228 , G06F17/30247 , G06F17/30256 , G06K9/32
Abstract: 具备:提取单元,从图像提取对象物;计算单元,计算提取的对象物所朝向的方向;以及赋予单元,根据计算出的方向,对所述图像赋予标签。
-
公开(公告)号:CN102741882A
公开(公告)日:2012-10-17
申请号:CN201180007696.5
申请日:2011-10-06
Applicant: 松下电器产业株式会社
CPC classification number: G06F17/30247
Abstract: 图像分类装置提取受理的图像各自的第1特征量(S22)、以及与该图像关联的关联图像各自的第2特征量(S25)。并且,基于提取的第1特征量及第2特征量的局部性,算出表示受理的图像的对象物所特有的特征的第3特征量(S26),基于算出的第3特征量制作模型数据(S27)。
-
公开(公告)号:CN102473411A
公开(公告)日:2012-05-23
申请号:CN201180002867.5
申请日:2011-03-15
Applicant: 松下电器产业株式会社
IPC: G10L11/00
CPC classification number: G10L25/48 , G06N5/04 , G06N99/005 , G06Q10/10
Abstract: 使用音频信号对运动图像进行分类。取得音频信号,针对取得的音频信号所包含的规定时间长度的多个区间的各个区间,提取作为与声音的频率分布有关的特征的区间特征,对提取的区间特征和各个基准区间特征进行比较,计算表示区间特征和基准区间特征之间的相关程度的区间类似度。针对取得的音频信号,提取基于在多个区间的各个区间中计算出的多个区间类似度的、与多个区间有关的特征即综合特征,比较提取的综合特征和基准综合特征,基于其结果对该音频信号进行分类。然后,将该分类结果用于运动图像的分类。
-
-
-
-
-
-
-
-
-