语音唤醒方法、电子设备及非暂态计算机可读存储介质

    公开(公告)号:CN109215647A

    公开(公告)日:2019-01-15

    申请号:CN201811004154.2

    申请日:2018-08-30

    Inventor: 李深 胡亚光

    Abstract: 本发明实施例提供了一种语音唤醒方法、电子设备及非暂态计算机可读存储介质,应用于语音识别技术领域。该方法包括:向第一语音识别模型中依次输入从语音信号中提取到的音频特征,当确定音频特征的置信度达到第一置信度阈值且未达到第一唤醒阈值时,向第一语音识别模型依次输入第二音频特征,且向第二语音识别模型依次输入确定出的待输入至第二语音识别模型中的第一音频特征,当满足第一预设条件时,确定执行唤醒操作,其中,第一预设条件包括:第一语音识别模型检测第二音频特征时,检测到置信度达到第一唤醒阈值,和/或,第二语音识别模型检测第一音频特征时,检测到置信度达到第二唤醒阈值。本发明实施例实现了如何实现语音唤醒。

    语音识别的方法、装置、电子设备及计算机可读存储介质

    公开(公告)号:CN109509475B

    公开(公告)日:2021-11-23

    申请号:CN201811618015.9

    申请日:2018-12-28

    Inventor: 李深 汪思学

    Abstract: 本申请提供了一种语音识别的方法、装置、电子设备及计算机可读存储介质,涉及语音识别领域。该方法包括:在接收到原始音频信号后,从原始音频信号中提取出对应的音频信号特征序列,并将音频信号特征序列输入预置的时间卷积网络模型,采用预置的算法依次生成对应的建模单元的分类概率值,再将建模单元的分类概率值输入预置的语音模型进行解码,就能够得到与语音对应的文本结果了。相对于现有技术,本申请采用预置的算法能够避免相邻时间窗口之间的重复计算,从而提高语音识别的速度。

    语音唤醒方法、装置及系统、终端和计算机可读存储介质

    公开(公告)号:CN110718212A

    公开(公告)日:2020-01-21

    申请号:CN201910966762.X

    申请日:2019-10-12

    Abstract: 本发明公开了一种语音唤醒方法、装置及系统、终端和计算机可读存储介质,该方法包括:实时采集声音信号;提取所述声音信号的音频特征;将所述音频特征输入第一唤醒词验证模型;通过所述第一唤醒词验证模型输出第一置信度;基于所述第一置信度处于第一指定阈值范围内的情况,将包括所述声音信号在内的已缓存信号集合发送至所述第二终端;接收所述第二终端对所述已缓存信号集合的验证结果;在所述验证结果为所述已缓存信号集合对应的第二置信度处于第二指定阈值范围内时,生成对应的功能唤醒指令。通过本发明的技术方案,既节省了第一终端的能耗,同时也通过二次检验保证了对语音验证的准确性,加快了语音唤醒的速度,提升了用户体验。

    语音唤醒的方法、装置、电子设备及计算机可读存储介质

    公开(公告)号:CN109065046A

    公开(公告)日:2018-12-21

    申请号:CN201811006300.5

    申请日:2018-08-30

    Inventor: 李深 胡亚光

    CPC classification number: G10L15/22 G10L15/16 G10L25/18 G10L2015/223

    Abstract: 本发明实施例提供了一种语音唤醒的方法、装置、电子设备及计算机可读存储介质,应用于语音识别技术领域。该方法包括:从采集到用户语音中提取频谱特征信息,然后将频谱特征信息输入至第一关键词检测模型,得到频谱特征信息对应的第一置信度,若频谱特征信息对应的第一置信度不小于第一置信度阈值,则将频谱特征信息以及频谱特征信息对应的第一置信度输入至第二关键词检测模型,得到检测结果,第一置信度阈值为第一关键词检测模型对应的置信度阈值,然后基于检测结果,确定是否执行语音唤醒操作。本发明实施例实现了降低对用户语音进行关键词检测的计算开销。

    语音验证方法及装置、电子设备和计算机可读存储介质

    公开(公告)号:CN110706691B

    公开(公告)日:2021-02-09

    申请号:CN201910966752.6

    申请日:2019-10-12

    Abstract: 本发明公开了一种语音验证方法及装置、电子设备和计算机可读存储介质,该方法包括:实时采集声音信号;提取声音信号的音频特征;将音频特征输入多分类验证模型,并通过多分类验证模型输出置信度集合,置信度集合包括非命令词置信度以及多个命令词的置信度;在置信度集合中选择最大置信度;基于最大置信度不是非命令词置信度的情况,加载最大置信度所属的目标命令词所对应的二分类验证模型;将音频特征输入二分类验证模型,并通过二分类验证模型输出目标命令词的目标置信度;基于目标置信度大于指定阈值的情况,执行与目标命令词相匹配的功能。通过本发明的技术方案,使得设备在节省电量消耗和系统资源消耗的同时,能够保证命令词检测的准确性。

    语音识别的方法、装置、电子设备及计算机可读存储介质

    公开(公告)号:CN109509475A

    公开(公告)日:2019-03-22

    申请号:CN201811618015.9

    申请日:2018-12-28

    Inventor: 李深 汪思学

    Abstract: 本申请提供了一种语音识别的方法、装置、电子设备及计算机可读存储介质,涉及语音识别领域。该方法包括:在接收到原始音频信号后,从原始音频信号中提取出对应的音频信号特征序列,并将音频信号特征序列输入预置的时间卷积网络模型,采用预置的算法依次生成对应的建模单元的分类概率值,再将建模单元的分类概率值输入预置的语音模型进行解码,就能够得到与语音对应的文本结果了。相对于现有技术,本申请采用预置的算法能够避免相邻时间窗口之间的重复计算,从而提高语音识别的速度。

Patent Agency Ranking