-
公开(公告)号:CN109215647A
公开(公告)日:2019-01-15
申请号:CN201811004154.2
申请日:2018-08-30
Applicant: 出门问问信息科技有限公司
Abstract: 本发明实施例提供了一种语音唤醒方法、电子设备及非暂态计算机可读存储介质,应用于语音识别技术领域。该方法包括:向第一语音识别模型中依次输入从语音信号中提取到的音频特征,当确定音频特征的置信度达到第一置信度阈值且未达到第一唤醒阈值时,向第一语音识别模型依次输入第二音频特征,且向第二语音识别模型依次输入确定出的待输入至第二语音识别模型中的第一音频特征,当满足第一预设条件时,确定执行唤醒操作,其中,第一预设条件包括:第一语音识别模型检测第二音频特征时,检测到置信度达到第一唤醒阈值,和/或,第二语音识别模型检测第一音频特征时,检测到置信度达到第二唤醒阈值。本发明实施例实现了如何实现语音唤醒。
-
公开(公告)号:CN109065044A
公开(公告)日:2018-12-21
申请号:CN201811004169.9
申请日:2018-08-30
Applicant: 出门问问信息科技有限公司
Inventor: 胡亚光
CPC classification number: G10L15/22 , G10L15/02 , G10L2015/027 , G10L2015/223
Abstract: 本发明实施例涉及语音处理领域,提供了一种唤醒词识别方法、装置、电子设备及计算机可读存储介质,其中,唤醒词识别方法包括:获取用户输入的待识别的语音信息;接着基于预设的语音识别模型,确定语音信息对应的第一音节序列;接着确定第一音节序列中是否包括预设唤醒词的第二音节序列;接着若包括,则确定语音信息中包括预设唤醒词,并执行相应的唤醒操作。本发明实施例的方法,根据音节序列即可识别出语音信息中是否包括唤醒词,而无需识别语音信息中是否包括唤醒词的字或词语,从而使得语音识别模型无需随着唤醒词的更改而更改,可以固定不变,极大降低设计的复杂度及研发成本。
-
公开(公告)号:CN109065036A
公开(公告)日:2018-12-21
申请号:CN201811005437.9
申请日:2018-08-30
Applicant: 出门问问信息科技有限公司
Inventor: 胡亚光
CPC classification number: G10L15/20 , G10L15/02 , G10L15/22 , G10L2015/027 , G10L2015/223
Abstract: 本发明实施例提供了一种语音识别的方法、装置、电子设备及计算机可读存储介质。该方法包括:基于当前环境中的声音,确定当前环境是否属于静音状态,当确定出当前环境不属于静音状态时,通过第一模型和/或第二模型,确定当前环境中的声音是否属于预设噪声,若确定出当前环境中的声音不属于预设噪声,则触发通过语音模型进行关键词检测。本发明实施例降低了误触发的概率,并降低了采集装置以及关键词检测装置的处理压力,进而可以提升用户体验。
-
公开(公告)号:CN110942777B
公开(公告)日:2022-03-08
申请号:CN201911234038.4
申请日:2019-12-05
Applicant: 出门问问信息科技有限公司
Abstract: 本发明公开了一种声纹神经网络模型的训练方法、装置及存储介质,首先采集语音训练样本;接着对所述语音训练样本进行特征提取,获得语音训练数据;进一步利用一维卷积网络结构和残差网络结构结合的方式来构建神经网络模型;最后利用所获得的语音训练数据对所述神经网络模型进行训练,得到训练好的声纹神经网络模型。
-
公开(公告)号:CN108899033B
公开(公告)日:2021-09-10
申请号:CN201810501729.5
申请日:2018-05-23
Applicant: 出门问问信息科技有限公司
Abstract: 本发明实施例公开了一种确定说话人特征的方法及装置,涉及数据处理技术领域,能够根据说话人提供的声音文本数据识别并确定说话人具有的特征信息,以便于开发人员依据得到的说话人特征能够更加有针对性地改进当前的智能化服务,以便于大大提高向说话人推送的个性化服务方案的应用价值。本发明实施例主要技术方案为:接收声音文本数据;从所述声音文本数据中提取声纹特征数据;利用预置模型对所述声纹特征数据进行处理,根据所述预置模型的输出数据,确定与所述声纹特征数据匹配的说话人特征。本发明实施例主要用于根据声音文本数据识别并确定说话人具有的特征信息。
-
公开(公告)号:CN109065044B
公开(公告)日:2021-04-02
申请号:CN201811004169.9
申请日:2018-08-30
Applicant: 出门问问信息科技有限公司
Inventor: 胡亚光
Abstract: 本发明实施例涉及语音处理领域,提供了一种唤醒词识别方法、装置、电子设备及计算机可读存储介质,其中,唤醒词识别方法包括:获取用户输入的待识别的语音信息;接着基于预设的语音识别模型,确定语音信息对应的第一音节序列;接着确定第一音节序列中是否包括预设唤醒词的第二音节序列;接着若包括,则确定语音信息中包括预设唤醒词,并执行相应的唤醒操作。本发明实施例的方法,根据音节序列即可识别出语音信息中是否包括唤醒词,而无需识别语音信息中是否包括唤醒词的字或词语,从而使得语音识别模型无需随着唤醒词的更改而更改,可以固定不变,极大降低设计的复杂度及研发成本。
-
公开(公告)号:CN108922547B
公开(公告)日:2021-04-23
申请号:CN201810502697.0
申请日:2018-05-23
Applicant: 出门问问信息科技有限公司
Abstract: 本发明实施例公开一种身份的识别方法、装置及电子设备,涉及终端应用技术领域,主要目的在于有效利用收集到的用户音频信息,提高用户身份识别的准确率。本发明实施例公开的实施例的技术方案包括:在接收到对智能设备的语音启动指令时,对所述语音启动指令进行声音识别,得到所述语音启动指令对应的第一用户身份信息;在接收到语音搜索指令时,对所述语音搜索指令进行声音识别,得到所述语音搜索指令对应的第二用户身份信息;对比所述第一用户身份信息及所述第二用户身份信息分别对应的加权结果,根据比对结果确定最终用户身份信息。
-
公开(公告)号:CN110942777A
公开(公告)日:2020-03-31
申请号:CN201911234038.4
申请日:2019-12-05
Applicant: 出门问问信息科技有限公司
Abstract: 本发明公开了一种声纹神经网络模型的训练方法、装置及存储介质,首先采集语音训练样本;接着对所述语音训练样本进行特征提取,获得语音训练数据;进一步利用一维卷积网络结构和残差网络结构结合的方式来构建神经网络模型;最后利用所获得的语音训练数据对所述神经网络模型进行训练,得到训练好的声纹神经网络模型。
-
公开(公告)号:CN109065046A
公开(公告)日:2018-12-21
申请号:CN201811006300.5
申请日:2018-08-30
Applicant: 出门问问信息科技有限公司
CPC classification number: G10L15/22 , G10L15/16 , G10L25/18 , G10L2015/223
Abstract: 本发明实施例提供了一种语音唤醒的方法、装置、电子设备及计算机可读存储介质,应用于语音识别技术领域。该方法包括:从采集到用户语音中提取频谱特征信息,然后将频谱特征信息输入至第一关键词检测模型,得到频谱特征信息对应的第一置信度,若频谱特征信息对应的第一置信度不小于第一置信度阈值,则将频谱特征信息以及频谱特征信息对应的第一置信度输入至第二关键词检测模型,得到检测结果,第一置信度阈值为第一关键词检测模型对应的置信度阈值,然后基于检测结果,确定是否执行语音唤醒操作。本发明实施例实现了降低对用户语音进行关键词检测的计算开销。
-
公开(公告)号:CN108986822A
公开(公告)日:2018-12-11
申请号:CN201811011980.X
申请日:2018-08-31
Applicant: 出门问问信息科技有限公司
Abstract: 本发明实施例涉及语音处理领域,提供了一种语音识别方法、装置、电子设备及非暂态计算机存储介质,其中,语音识别方法包括:获取终端采集到的待识别的音频数据;接着通过VAD算法,确定待识别的音频数据中是否包括语音信号;接着如果包括语音信号,则基于音频数据识别唤醒词。本发明实施例的方法,使得只有在音频数据中包括语音信号时,才对音频数据进行唤醒词的识别,有效避免了无论采集到什么样的音频数据,均需要对其进行唤醒词识别的情况,从而极大降低了系统的功耗,提升了用户体验。
-
-
-
-
-
-
-
-
-