图像识别装置、图像识别方法、程序及集成电路

    公开(公告)号:CN103348381A

    公开(公告)日:2013-10-09

    申请号:CN201280004198.X

    申请日:2012-11-27

    Abstract: 图像识别装置具有:第1识别步骤,从图像中识别第1物体;计算步骤,计算表示被识别出的第1物体的属性的属性信息;物体确定步骤,参照将表示第2物体的识别符与每个属性信息相对应的物体对应信息,确定与计算出的属性信息对应的表示第2物体的识别符;区域确定步骤,参照将根据第1区域来确定第2区域时使用的值与每个表示第2物体的识别符相对应的区域值信息,使用与所确定出的识别符对应的值来确定第2区域,所述第1区域是所述第1物体占据的区域;以及第2识别步骤,将所确定出的第2区域作为对象,识别与所述确定出的识别符对应的第2物体。

    声音输出装置及声音输出方法

    公开(公告)号:CN1759436A

    公开(公告)日:2006-04-12

    申请号:CN200480006231.8

    申请日:2004-04-27

    CPC classification number: G06F3/16

    Abstract: 一种声音输出装置,它能够把利用文字和声音的信息准确地传达给用户,提高与用户之间的连系的完善性,其中具有:显示部(107),它利用文字来显示应向用传达的装置传达信息;延迟部(105),它推断出用户为识别该显示部(107)进行显示的文字的动作所需要的延迟时间(T),在该文字显示后延迟时间(T)已过去时,用声音来输出该装置传达信息;以及声音输出部(106)。

    运动图像解析装置、运动图像解析方法、程序及集成电路

    公开(公告)号:CN103597817A

    公开(公告)日:2014-02-19

    申请号:CN201380001598.X

    申请日:2013-04-03

    CPC classification number: G06K9/00744 G11B27/105 G11B27/28

    Abstract: 本发明的运动图像解析装置,在运动图像中确定与一个目标物有关的目标物关联区间,该运动图像解析装置具备目标物关联区间确定部,该目标物关联区间确定部在判定为满足规定的条件的情况下,将与检测到所述一个目标物的检测区间在时间上连续的区间、并且是未检测到所述一个目标物的区间即非检测区间确定为所述目标物关联区间,在判定为不满足所述规定的条件的情况下,不将与检测到所述一个目标物的检测区间在时间上连续的区间、并且是未检测到所述一个目标物的区间即非检测区间确定为所述目标物关联区间。根据本发明的运动图像解析装置,能够在运动图像中适当地确定与一个目标物相关联的区间。

    声音处理装置、声音处理方法、程序及集成电路

    公开(公告)号:CN103534755A

    公开(公告)日:2014-01-22

    申请号:CN201380001357.5

    申请日:2013-03-11

    Abstract: 本发明提供一种声音处理装置,根据AV内容的音频信号检测声音特征的变化点。为了解决上述问题,该声音处理装置具有:特征计算单元,按照所输入的音频信号的预定时间长度的每个单位区间,计算表示所述音频信号的特征的区间特征;边界计算单元,对于多个所述单位区间中的每个单位区间,计算与包括该单位区间在内的由区间特征相似的多个所述单位区间构成的相似区间、和其它区间的边界相关的边界信息;以及判定单元,计算所述边界信息所表示的各个边界的优先度,根据所述优先度判定所述各个边界是否是场景变化点。

    语音识别词典制作装置及信息检索装置

    公开(公告)号:CN100545907C

    公开(公告)日:2009-09-30

    申请号:CN200410030416.4

    申请日:2004-03-15

    CPC classification number: G10L15/063 G10L2015/0631

    Abstract: 节目指南装置具备:识别字词储存部(105),用来存储过去识别字词,该过去识别字词是过去通过语音识别所识别出的字词;视听履历字词储存部(106),用来存储视听履历字词,该视听履历字词是所视听的节目信息;词典制作部(103),用来制作利用者自适应式识别词典和加权利用者自适应式识别词典,该利用者自适应式识别词典已在基本识别词典中添加基本识别词典中不存在的过去识别字词及视听履历字词,该加权利用者自适应式识别词典已按照「对象权重系数」及「履历权重系数」实行加权,该「对象权重系数」与字词的种类相应,该「履历权重系数」与是否作为过去识别字词及视听履历字词被存储相应。

    助听器装置
    8.
    发明授权

    公开(公告)号:CN102428716B

    公开(公告)日:2014-07-30

    申请号:CN201080021517.9

    申请日:2010-06-16

    Abstract: 没有在语音识别精度上的降低,通过使用从多个麦克风输入的声音信号检测由除了会话对方之外的某人的呼叫和其他各种声音。助听器装置基于除了会话对方之外的某人的呼叫语音到来的方向,校正除了会话对方之外的某人的呼叫语音的频率特性,基于通过多个麦克风转换的声音信号来估计该方向。然后,基于通过使用具有一个特性的麦克风记录的其他语音数据,助听器装置将其频率特性已经被频率特性调整处理单元校正的、除了会话对方之外的某人的呼叫语音与用于表示音素和音节特征的呼叫词标准模式作比较。通过这个比较,该助听器装置确定除了会话对方之外的某人的呼叫语音是否是呼叫词。然后,基于呼叫词确定部件的确定结果,助听器装置相对于除了会话对方的语音到来的方向之外的方向形成定向。另外,该助听器装置校正除了会话对方之外的某人的呼叫语音的频率特性,使得该频率特性可以与在准备声音标准模式时的麦克风的特性相同。

    声音输出装置及声音输出方法

    公开(公告)号:CN100583236C

    公开(公告)日:2010-01-20

    申请号:CN200480006231.8

    申请日:2004-04-27

    CPC classification number: G06F3/16

    Abstract: 一种声音输出装置,它能够把利用文字和声音的信息准确地传达给用户,提高与用户之间的联系的完善性,其中具有:显示部(107),它利用文字来显示应向用传达的装置传达信息;延迟部(105),它推断出用户为识别该显示部(107)进行显示的文字的动作所需要的延迟时间(T),在该文字显示后延迟时间(T)已过去时,用声音来输出该装置传达信息;以及声音输出部(106)。

    关键词提取装置
    10.
    发明公开

    公开(公告)号:CN101542592A

    公开(公告)日:2009-09-23

    申请号:CN200880000290.2

    申请日:2008-03-14

    CPC classification number: G10L15/04 G10L17/00 G10L2015/088

    Abstract: 提取会话的关键词而不是提前预测并准备会话的关键词。关键词提取装置,包括:音频输入部分(101),用于输入说话者的讲话;讲话片段确定部分(102),用于确定每个说话者的输入讲话的讲话片段;讲话识别部分(103),用于识别在所确定的讲话片段的讲话;中断检测部分(104),基于另一个说话者对说话者的讲话的响应检测暗示关键词存在的另一个说话者的讲话响应特征,即,在前讲话和后续讲话相互重叠的中断;关键词提取部分(105),用于从根据中断所指定的讲话部分中的讲话中提取关键词;关键词搜索部分(106),用于通过关键词执行关键词搜索;以及显示部分(107),用于显示关键词搜索的结果。

Patent Agency Ranking