-
公开(公告)号:CN110580908A
公开(公告)日:2019-12-17
申请号:CN201910932340.0
申请日:2019-09-29
Applicant: 出门问问信息科技有限公司
Abstract: 本发明公开了一种支持不同语种的命令词检测方法及设备,首先采集至少包括两种不同语种的语音信号;接着提取所述语音信号的音频特征;进一步地通过深度学习网络对所提取的音频特征进行分类预测,得到分类预测结果;若所述分类预测结果为命令词的概率最大,则将所述概率最大的命令词作为输出结果。
-
公开(公告)号:CN110556099A
公开(公告)日:2019-12-10
申请号:CN201910862347.X
申请日:2019-09-12
Applicant: 出门问问信息科技有限公司
Abstract: 本发明公开了一种命令词控制方法及设备,首先以固定帧长采集流式声音信号帧;之后对所采集的流式声音信号帧进行特征提取,得到包括命令词在内的音频特征;控制执行对应所述命令词的操作。
-
公开(公告)号:CN109215647A
公开(公告)日:2019-01-15
申请号:CN201811004154.2
申请日:2018-08-30
Applicant: 出门问问信息科技有限公司
Abstract: 本发明实施例提供了一种语音唤醒方法、电子设备及非暂态计算机可读存储介质,应用于语音识别技术领域。该方法包括:向第一语音识别模型中依次输入从语音信号中提取到的音频特征,当确定音频特征的置信度达到第一置信度阈值且未达到第一唤醒阈值时,向第一语音识别模型依次输入第二音频特征,且向第二语音识别模型依次输入确定出的待输入至第二语音识别模型中的第一音频特征,当满足第一预设条件时,确定执行唤醒操作,其中,第一预设条件包括:第一语音识别模型检测第二音频特征时,检测到置信度达到第一唤醒阈值,和/或,第二语音识别模型检测第一音频特征时,检测到置信度达到第二唤醒阈值。本发明实施例实现了如何实现语音唤醒。
-
公开(公告)号:CN110556099B
公开(公告)日:2021-12-21
申请号:CN201910862347.X
申请日:2019-09-12
Applicant: 出门问问信息科技有限公司
Abstract: 本发明公开了一种命令词控制方法及设备,首先以固定帧长采集流式声音信号帧;之后对所采集的流式声音信号帧进行特征提取,得到包括命令词在内的音频特征;控制执行对应所述命令词的操作。
-
公开(公告)号:CN109509475B
公开(公告)日:2021-11-23
申请号:CN201811618015.9
申请日:2018-12-28
Applicant: 出门问问信息科技有限公司
Abstract: 本申请提供了一种语音识别的方法、装置、电子设备及计算机可读存储介质,涉及语音识别领域。该方法包括:在接收到原始音频信号后,从原始音频信号中提取出对应的音频信号特征序列,并将音频信号特征序列输入预置的时间卷积网络模型,采用预置的算法依次生成对应的建模单元的分类概率值,再将建模单元的分类概率值输入预置的语音模型进行解码,就能够得到与语音对应的文本结果了。相对于现有技术,本申请采用预置的算法能够避免相邻时间窗口之间的重复计算,从而提高语音识别的速度。
-
公开(公告)号:CN110718212A
公开(公告)日:2020-01-21
申请号:CN201910966762.X
申请日:2019-10-12
Applicant: 出门问问信息科技有限公司
Abstract: 本发明公开了一种语音唤醒方法、装置及系统、终端和计算机可读存储介质,该方法包括:实时采集声音信号;提取所述声音信号的音频特征;将所述音频特征输入第一唤醒词验证模型;通过所述第一唤醒词验证模型输出第一置信度;基于所述第一置信度处于第一指定阈值范围内的情况,将包括所述声音信号在内的已缓存信号集合发送至所述第二终端;接收所述第二终端对所述已缓存信号集合的验证结果;在所述验证结果为所述已缓存信号集合对应的第二置信度处于第二指定阈值范围内时,生成对应的功能唤醒指令。通过本发明的技术方案,既节省了第一终端的能耗,同时也通过二次检验保证了对语音验证的准确性,加快了语音唤醒的速度,提升了用户体验。
-
公开(公告)号:CN109065046A
公开(公告)日:2018-12-21
申请号:CN201811006300.5
申请日:2018-08-30
Applicant: 出门问问信息科技有限公司
CPC classification number: G10L15/22 , G10L15/16 , G10L25/18 , G10L2015/223
Abstract: 本发明实施例提供了一种语音唤醒的方法、装置、电子设备及计算机可读存储介质,应用于语音识别技术领域。该方法包括:从采集到用户语音中提取频谱特征信息,然后将频谱特征信息输入至第一关键词检测模型,得到频谱特征信息对应的第一置信度,若频谱特征信息对应的第一置信度不小于第一置信度阈值,则将频谱特征信息以及频谱特征信息对应的第一置信度输入至第二关键词检测模型,得到检测结果,第一置信度阈值为第一关键词检测模型对应的置信度阈值,然后基于检测结果,确定是否执行语音唤醒操作。本发明实施例实现了降低对用户语音进行关键词检测的计算开销。
-
公开(公告)号:CN110706691B
公开(公告)日:2021-02-09
申请号:CN201910966752.6
申请日:2019-10-12
Applicant: 出门问问信息科技有限公司
Abstract: 本发明公开了一种语音验证方法及装置、电子设备和计算机可读存储介质,该方法包括:实时采集声音信号;提取声音信号的音频特征;将音频特征输入多分类验证模型,并通过多分类验证模型输出置信度集合,置信度集合包括非命令词置信度以及多个命令词的置信度;在置信度集合中选择最大置信度;基于最大置信度不是非命令词置信度的情况,加载最大置信度所属的目标命令词所对应的二分类验证模型;将音频特征输入二分类验证模型,并通过二分类验证模型输出目标命令词的目标置信度;基于目标置信度大于指定阈值的情况,执行与目标命令词相匹配的功能。通过本发明的技术方案,使得设备在节省电量消耗和系统资源消耗的同时,能够保证命令词检测的准确性。
-
公开(公告)号:CN110660385A
公开(公告)日:2020-01-07
申请号:CN201910941654.7
申请日:2019-09-30
Applicant: 出门问问信息科技有限公司
IPC: G10L15/16 , G10L15/183 , G10L15/22 , G10L15/02 , H04R1/10
Abstract: 本发明公开了一种命令词检测方法及电子设备,首先采集语音信号;之后对所采集的语音信号进行特征提取,得到包括多个命令词的音频特征;接着将所述包括多个命令词的音频特征进行编码,得到多个命令词向量;进一步将所述多个命令词向量按照对应场景类别选择特定多分类器进行命令词检测,得到有效命令词。
-
公开(公告)号:CN109509475A
公开(公告)日:2019-03-22
申请号:CN201811618015.9
申请日:2018-12-28
Applicant: 出门问问信息科技有限公司
Abstract: 本申请提供了一种语音识别的方法、装置、电子设备及计算机可读存储介质,涉及语音识别领域。该方法包括:在接收到原始音频信号后,从原始音频信号中提取出对应的音频信号特征序列,并将音频信号特征序列输入预置的时间卷积网络模型,采用预置的算法依次生成对应的建模单元的分类概率值,再将建模单元的分类概率值输入预置的语音模型进行解码,就能够得到与语音对应的文本结果了。相对于现有技术,本申请采用预置的算法能够避免相邻时间窗口之间的重复计算,从而提高语音识别的速度。
-
-
-
-
-
-
-
-
-