-
公开(公告)号:CN112673422A
公开(公告)日:2021-04-16
申请号:CN201980058863.5
申请日:2019-08-28
Applicant: 日本电信电话株式会社
Abstract: 对应于利用方法恰当地使操作变化。关键字检测单元(11)生成表示从输入声音检测出特定的关键字的发音的结果的关键字检测结果。声音检测单元(12)生成表示从输入声音检测出声音区间的结果的声音区间检测结果。连续发言检测单元(13)在关键字检测结果表示检测出关键字且声音区间检测结果表示检测出声音区间的情况下,生成表示是连续发言的连续发言检测结果。
-
公开(公告)号:CN112655043A
公开(公告)日:2021-04-13
申请号:CN201980057870.3
申请日:2019-08-28
Applicant: 日本电信电话株式会社
Abstract: 抑制对并未意图要检测关键字却说出的关键字的误检测。关键字检测单元(11)生成表示从输入声音检测出特定的关键字的发音的结果的关键字检测结果。声音检测单元(12)生成表示从输入声音检测出声音区间的结果的声音区间检测结果。延迟单元(13)向声音区间检测结果赋予至少比关键字的发言时间长的延迟。句中关键字排除单元(14)在关键字检测结果表示检测出关键字且声音区间检测结果表示检测出声音区间时,将关键字检测结果更新为表示未检测出关键字的结果。
-
公开(公告)号:CN112514416A
公开(公告)日:2021-03-16
申请号:CN201980051002.4
申请日:2019-07-10
Applicant: 日本电信电话株式会社
Abstract: 本发明提供减少音像的不适感并抑制由于追加扬声器对啸声的影响的拾音扩音装置。对于拾音扩音装置而言,设采集从车辆内的第一座位发出的目标声音,从第二扩音装置对听众再生所采集的目标声音,进一步从第一扩音装置对听众再生所采集的目标声音,其中,当从坐在车辆内的第二座位的听众观察时该第二扩音装置被配置于与第一座位不同的方向上,当从听众观察时该第一扩音装置配置于与第一座位相同的方向上,将目标声音乘以第一增益,并输出至第一扩音装置,使目标声音延迟相当于对第一扩音装置相对于第二扩音装置的延迟时间加上用于获得优先效应的时间所得的时间量,将已延迟的目标声音乘以第二增益,并输出至第二扩音装置,第一增益调整部将第一增益调整为较小的值,第二增益调整部将第二增益调整为较大的值。
-
公开(公告)号:CN111108362A
公开(公告)日:2020-05-05
申请号:CN201880057321.1
申请日:2018-08-24
Applicant: 日本电信电话株式会社
Abstract: 使用少量的异常声音数据,提高无监督异常声音探测的精度。阈值决定单元(13)用使用正常声音数据学习的正常模型和表现了异常声音数据的异常模型,对多个异常声音数据的每一个计算异常度,将其最小值决定为阈值。权重更新单元(14)使用多个正常声音数据、异常声音数据和阈值,更新异常模型的权重,使得全部异常声音数据被判定为异常、正常声音数据被判定为异常的概率最小。
-
公开(公告)号:CN110036441B
公开(公告)日:2023-02-17
申请号:CN201780075048.0
申请日:2017-09-12
Applicant: 日本电信电话株式会社
IPC: G10L21/0264 , G10L21/0232
Abstract: 本发明提供噪音估计用参数学习装置,即使在混响或时间帧差成为问题的大规模空间中,也可以使配置在远离的位置的多个麦克风协作而执行频谱相减法,强调目标音。学习多个麦克风的观测信号中包含的噪音的估计中使用的噪音估计用参数的噪音估计用参数学习装置包括:模型化单元,将规定的麦克风的观测信号的概率分布模型化,将时间帧差的概率分布模型化,将传递函数增益的概率分布模型化;似然函数设定单元,根据模型化的概率分布,设定与时间帧差有关的似然函数、与传递函数增益有关的似然函数;以及参数更新单元,交替地反复更新两个似然函数的变量,将收敛后的时间帧差以及传递函数增益作为噪音估计用参数输出。
-
公开(公告)号:CN110352349B
公开(公告)日:2023-01-31
申请号:CN201780086118.2
申请日:2017-09-14
Applicant: 日本电信电话株式会社
Abstract: 提供与有无异常音的学习数据无关、可以生成用于异常音检测的特征量提取函数的异常音检测学习技术。异常音检测学习装置包括:根据变分自动编码器的最佳化指标,更新输入的特征量提取函数以及特征量逆变换函数的第一函数更新单元(3);根据正常音的学习数据提取正常音的音响特征量的音响特征量提取单元(4);使用提取的音响特征量更新正常音模型的正常音模型更新单元(5);使用正常音的学习数据以及输入的特征量提取函数,求与作为规定的值的伪阳性率ρ对应的阈值的阈值更新单元(6);根据由求出的阈值决定的内曼皮尔森型最佳化指标,将更新的特征量提取函数更新的第二函数更新单元(8),反复进行上述各单元的处理。
-
公开(公告)号:CN112514416B
公开(公告)日:2022-06-07
申请号:CN201980051002.4
申请日:2019-07-10
Applicant: 日本电信电话株式会社
Abstract: 本发明提供减少音像的不适感并抑制由于追加扬声器对啸声的影响的拾音扩音装置。对于拾音扩音装置而言,设采集从车辆内的第一座位发出的目标声音,从第二扩音装置对听众再生所采集的目标声音,进一步从第一扩音装置对听众再生所采集的目标声音,其中,当从坐在车辆内的第二座位的听众观察时该第二扩音装置被配置于与第一座位不同的方向上,当从听众观察时该第一扩音装置配置于与第一座位相同的方向上,将目标声音乘以第一增益,并输出至第一扩音装置,使目标声音延迟相当于对第一扩音装置相对于第二扩音装置的延迟时间加上用于获得优先效应的时间所得的时间量,将已延迟的目标声音乘以第二增益,并输出至第二扩音装置,第一增益调整部将第一增益调整为较小的值,第二增益调整部将第二增益调整为较大的值。
-
公开(公告)号:CN112544088B
公开(公告)日:2022-05-24
申请号:CN201980050993.4
申请日:2019-07-29
Applicant: 日本电信电话株式会社
IPC: H04R3/00 , B60R11/02 , G10L21/0208
Abstract: 本发明涉及拾音扩音装置、其方法及记录介质。求出第一噪声电平,其是从采集从第一拾音扩音位置发出的声音的第一麦克风获得的第一拾音信号所包含的噪声成分的大小的推定值,求出第二噪声电平,其是从采集从第二拾音扩音位置发出的声音的第二麦克风获得的第二拾音信号所包含的噪声成分的大小的推定值,求出再生噪声电平相对于第二噪声电平的比,以该比与噪声抑制量的积成为预先设定的常数的方式求出噪声抑制量,第二噪声电平是与第二噪声电平对应的第二拾音扩音位置的搭乘者的位置处的噪声的大小的推定值,再生噪声电平是从设置于第二拾音扩音位置的第二扬声器再生第一噪声电平的情况下的第二拾音扩音位置的搭乘者的位置处的噪声的大小的推定值。
-
公开(公告)号:CN111108362B
公开(公告)日:2022-05-24
申请号:CN201880057321.1
申请日:2018-08-24
Applicant: 日本电信电话株式会社
Abstract: 使用少量的异常声音数据,提高无监督异常声音探测的精度。阈值决定单元(13)用使用正常声音数据学习的正常模型和表现了异常声音数据的异常模型,对多个异常声音数据的每一个计算异常度,将其最小值决定为阈值。权重更新单元(14)使用多个正常声音数据、异常声音数据和阈值,更新异常模型的权重,使得全部异常声音数据被判定为异常、正常声音数据被判定为异常的概率最小。
-
公开(公告)号:CN113899577A
公开(公告)日:2022-01-07
申请号:CN202111206117.1
申请日:2018-08-24
Applicant: 日本电信电话株式会社
Abstract: 本发明提供异常声音探测装置、异常声音生成装置、异常数据生成装置、异常模型学习装置、异常声音生成方法以及记录介质,该异常声音探测装置包括:模型存储单元,存储将预先准备的异常声音数据建模后的概率分布即第1异常模型和将与所述异常声音数据不同的异常声音即追加异常声音建模后的概率分布即第2异常模型;异常度获取单元,对于输入的对象声音数据,组合所述第1异常模型和所述第2异常模型来计算异常度;以及状态判定单元,将所述异常度与规定的阈值比较,判定所述对象声音数据是正常声音还是异常声音。
-
-
-
-
-
-
-
-
-