-
公开(公告)号:CN115547289A
公开(公告)日:2022-12-30
申请号:CN202211142609.3
申请日:2022-09-20
Applicant: 出门问问信息科技有限公司
Abstract: 本公开提供了一种语音合成方法、装置、电子设备及存储介质,所述方法包括:确定用于语音合成的原始语料;从所述原始语料中提取文本对话表现力,所述文本对话表现力包括对话意向和对话风格;基于所述文本对话表现力确定文本对话风格特征;将所述文本对话风格特征输入至语音合成模型,基于所述语音合成模型输出的梅尔频谱,确定所述原始语料对应的对话语音。
-
公开(公告)号:CN115470350A
公开(公告)日:2022-12-13
申请号:CN202211116335.0
申请日:2022-09-14
Applicant: 出门问问信息科技有限公司
IPC: G06F16/35 , G06F40/30 , G06F40/289 , G10L13/10
Abstract: 本申请提供了一种韵律模型的构建方法和装置、韵律标注方法、电子设备和可读存储介质,该构建方法包括:获取输入数据的预测提示,其中预测提示用于指示对输入数据执行韵律标注时的韵律等级;基于预测提示,对输入数据进行韵律标注,获得具有预测提示中韵律等级的韵律标注文本;以及根据韵律标注文本与输入数据的预期标注文本之间的标注误差,对分类器进行参数调整,以获得使标注误差处于期望误差范围的韵律模型。本申请克服了对输入数据中预期标注文本的完整性的依赖,降低了输入数据的获取难度。
-
公开(公告)号:CN115470351A
公开(公告)日:2022-12-13
申请号:CN202211117014.2
申请日:2022-09-14
Applicant: 出门问问信息科技有限公司
IPC: G06F16/35 , G06F40/30 , G06F40/289 , G10L13/10
Abstract: 本申请提供了一种韵律模型的构建方法和装置、韵律标注方法、电子设备,包括:获取输入数据,以及各个前序分类器对输入数据中训练文本的前序标注文本,其中输入数据的韵律等级高于各个前序分类器对应的韵律等级;基于输入数据和多个前序标注文本,对初始分类器进行参数调整,以获得目标分类器;以及整合各个前序分类器和目标分类器,获得韵律模型。
-
公开(公告)号:CN109065016B
公开(公告)日:2021-04-13
申请号:CN201811004153.8
申请日:2018-08-30
Applicant: 出门问问信息科技有限公司
Inventor: 叶顺平
Abstract: 本发明实施例涉及语音处理技术领域,提供了一种语音合成方法、装置、电子设备及非暂态计算机存储介质,其中,语音合成方法包括:获取待合成语音的文本信息;接着基于预先建立的语音合成模型,对文本信息进行语音合成处理,得到相应的语音信号,语音合成模型包括利用比特表示节点与节点之间的连接关系的字典树;接着输出语音信号。本发明实施例的方法,利用比特表示节点与节点之间的连接关系的字典树替代传统的利用指针表示节点与节点之间的连接关系的字典树,极大减小了占用的内存空间,利于后续提高内存空间的使用效率。
-
公开(公告)号:CN109272995A
公开(公告)日:2019-01-25
申请号:CN201811126924.0
申请日:2018-09-26
Applicant: 出门问问信息科技有限公司
IPC: G10L15/18
Abstract: 本发明实施例公开了一种语音识别方法、装置及电子设备。其中方法包括:获取采集到的用户输入的语音信息;根据至少一个与用户相匹配的语言模型对语音信息进行识别,得到语音识别结果。本发明实施例采用至少一个与用户相匹配的语言模型对语音信息进行识别,这种通过与用户相匹配的语言模型对语音信息进行识别的方式,实现了通过指定语言模型以识别语音信息的目的,不仅提高了对语音信息识别的精确度,保证了识别结果能够符合用户的个性化需求,而且提高了语音识别的准确性和识别效率,解决了相关技术中采用的无差别的通用语言模型进行识别导致的无法识别甚至错误识别的技术问题,提高了用户体验。
-
公开(公告)号:CN109065045A
公开(公告)日:2018-12-21
申请号:CN201811004170.1
申请日:2018-08-30
Applicant: 出门问问信息科技有限公司
Abstract: 本发明实施例公开了一种语音识别方法、装置、电子设备及计算机可读存储介质,该方法包括:获取用户的当前语音信息,并对当前语音信息进行识别;若在当前语音信息中识别出目标关键词,则在预配置的至少两个语音识别模型中,将与目标关键词对应的语音识别模型确定为目标语音识别模型。本发明实施例的方案,可基于用户的当前语音信息中的目标关键词,确定与目标关键词相对应的语音识别模型,由于该语音识别模型是与目标关键词相对应的,因此可基于目标关键词快速匹配到对应的语音识别模型,进而利用该语音识别模型对当前语音信息进行识别时,可以提高语音识别准确率,同时,也可以缩短语音识别时间,提高识别效率。
-
公开(公告)号:CN108899036A
公开(公告)日:2018-11-27
申请号:CN201810549538.6
申请日:2018-05-31
Applicant: 出门问问信息科技有限公司
IPC: G10L17/22 , G10L17/00 , G11B20/10 , G11C7/20 , G06F3/0488
Abstract: 本发明实施例提供一种语音数据的处理方法及装置,所述方法包括:获得来自第一用户的操作信息;基于所述操作信息,确定第一用户对应的用户意图信息;如果所述用户意图信息用于指示播放来自第二用户的语音留言,基于所述用户意图信息,获取与所述用户意图信息对应的待播放的第一语音留言数据,其中,所述第一语音留言数据由第二用户录制;播放所述第一语音留言数据。如此,通过识别用户意图信息来获取待播放的语音留言数据并进行播放,能够丰富智能音频设备的功能和提高智能音频设备的智能程度。
-
公开(公告)号:CN109376354A
公开(公告)日:2019-02-22
申请号:CN201811125619.X
申请日:2018-09-26
Applicant: 出门问问信息科技有限公司
IPC: G06F17/27 , G06F16/332 , G06F16/951 , G06Q30/00 , G06Q50/26
Abstract: 本发明实施例公开了一种欺诈行为识别方法、装置、电子设备及可读存储介质,属于信息处理技术领域。该识别方法包括:获取用户的咨询信息;根据咨询信息和预配置的知识库,确定与咨询信息关联的提问信息和提问信息的答案信息;将提问信息反馈给用户;获取用户基于提问信息反馈的解答信息;通过神经网络,计算解答信息和答案信息之间的语义相似度,根据语义相似度。本发明实施例提供的方案,实现了欺诈行为的自动识别,能够在为解答咨询信息之前,对用户的可信性进行验证,以确保用户身份的安全性,更好的满足了实际应用需求。
-
公开(公告)号:CN109036424A
公开(公告)日:2018-12-18
申请号:CN201811005452.3
申请日:2018-08-30
Applicant: 出门问问信息科技有限公司
CPC classification number: G10L15/26 , G10L15/07 , G10L15/22 , G10L2015/223
Abstract: 本发明实施例公开了一种语音识别方法、装置、电子设备及计算机可读存储介质,该方法包括:获取用户的第一语音信息;确定与用户对应的语料库;基于与用户对应的语料库,对第一语音信息进行识别,得到第一语音识别结果。本发明实施例的方案,可基于与用户的第一语音信息,确定与用户对应的语料库,由于该语料库是与用户对应的,因此,通过该语料库中的语料可对第一语音信息进行有针对的识别,提高了语音识别的准确性。
-
公开(公告)号:CN108962250A
公开(公告)日:2018-12-07
申请号:CN201811126305.1
申请日:2018-09-26
Applicant: 出门问问信息科技有限公司
IPC: G10L15/22
CPC classification number: G10L15/22 , G10L2015/223 , G10L2015/225
Abstract: 本发明实施例涉及语音识别技术领域,特别是涉及一种语音识别方法、装置及电子设备,该语音识别方法,包括:基于用户输入的特定输入信息触发设备唤醒;基于用户输入的操作指令,确定所述操作指令的输入时间是否在所述设备处于唤醒状态的预设时间段内;若在所述设备处于唤醒状态的预设时间段内,基于用户输入的操作指令执行对应的操作处理。本发明实施例中,实现了在一定时间内基于一次唤醒的多个指令执行过程,降低了设备的处理消耗,简化了处理过程,并且提升了用户的使用体验。
-
-
-
-
-
-
-
-
-