-
公开(公告)号:CN112447176B9
公开(公告)日:2024-10-25
申请号:CN202010127371.1
申请日:2020-02-28
Applicant: 株式会社东芝
Abstract: 实施方式涉及信息处理装置、关键词检测装置以及信息处理方法。提供能够高效地进行学习的装置以及方法。实施方式涉及的装置具备取得部、学习部、提取部以及自适应部。取得部取得包含特征量及其正解音素标签的学习数据。学习部使声学模型进行学习以使得当输入特征量时输出音素标签。提取部从学习数据提取包含关键词、其所包含的子词、音节、或者音素的特征量的数据。自适应部使用所提取的数据,使关键词检测模型对声学模型进行自适应。
-
公开(公告)号:CN112420020B
公开(公告)日:2024-05-03
申请号:CN202010127298.8
申请日:2020-02-28
Applicant: 株式会社东芝
Abstract: 实施方式提供能够精度良好地根据声音检测关键词的信息处理装置和信息处理方法。有关实施方式的信息处理装置具有第一及第二取得部、第一及第二计算部和判定部。第一取得部取得声音数据,第二取得部取得已学习模型,当输入声音数据的特征量时输出与关键词和背景噪声相关的似然度。第一及第二计算部对声音数据的每一帧计算关键词分数及背景噪声分数。判定部判定声音数据是否包含关键词。
-
公开(公告)号:CN112447176B
公开(公告)日:2024-09-24
申请号:CN202010127371.1
申请日:2020-02-28
Applicant: 株式会社东芝
Abstract: 实施方式涉及信息处理装置、关键词检测装置以及信息处理方法。提供能够高效地进行学习的装置以及方法。实施方式涉及的装置具备取得部、学习部、提取部以及自适应部。取得部取得包含特征量及其正解音素标签的学习数据。学习部使声学模型进行学习以使得当输入特征量时输出音素标签。提取部从学习数据提取包含关键词、其所包含的子词、音节、或者音素的特征量的数据。自适应部使用所提取的数据,使关键词检测模型对声学模型进行自适应。
-
公开(公告)号:CN112420020A
公开(公告)日:2021-02-26
申请号:CN202010127298.8
申请日:2020-02-28
Applicant: 株式会社东芝
Abstract: 实施方式提供能够精度良好地根据声音检测关键词的信息处理装置和信息处理方法。有关实施方式的信息处理装置具有第一及第二取得部、第一及第二计算部和判定部。第一取得部取得声音数据,第二取得部取得已学习模型,当输入声音数据的特征量时输出与关键词和背景噪声相关的似然度。第一及第二计算部对声音数据的每一帧计算关键词分数及背景噪声分数。判定部判定声音数据是否包含关键词。
-
公开(公告)号:CN104865550A
公开(公告)日:2015-08-26
申请号:CN201510086405.6
申请日:2015-02-16
Applicant: 株式会社东芝
IPC: G01S3/808
CPC classification number: H04R1/406 , H04R2430/23 , G01S3/8083
Abstract: 本发明提供声源方向估计设备和声源方向估计方法。根据实施例,声源方向估计设备包含获取单元、生成器、比较器和估计器。获取单元被配置成从多个传声器获取多个信道的声信号。生成器被配置成对于每个预定频率窗,计算多个信道的声信号的相位差,以生成相位差分布。比较器被配置成将相位差分布与预先对于每个方向生成的模板进行比较,并且按照相位差分布和每个方向的模板之间的相似性来计算分数。估计器被配置成基于计算出的分数来估计声源的方向。
-
-
-
-