-
公开(公告)号:CN112053686B
公开(公告)日:2024-01-02
申请号:CN202010739039.0
申请日:2020-07-28
Applicant: 出门问问信息科技有限公司
Abstract: 本发明公开了一种音频中断方法、装置以及计算机可读存储介质,包括:获取音频数据的多个特征向量数据;针对多个所述特征向量数据,生成用于表征所述音频数据为特定音频的置信度;根据所生成的置信度,停止当前音频信息的输出。由此,通过利用特征向量数据所生成的置信度来决定停止当前音频信息的输出,不需要通过现有技术中语音识别解码器得到识别结果,大大减少了计算量,进而降低了打断的延迟,提升了用户体验。
-
公开(公告)号:CN111312226A
公开(公告)日:2020-06-19
申请号:CN202010096208.3
申请日:2020-02-17
Applicant: 出门问问信息科技有限公司
Inventor: 陈晓宇
Abstract: 本发明公开了一种语音识别方法、设备及计算机可读存储介质,所述方法包括:根据语音识别结果获得标签信息;基于所述标签信息确定标签发音序列;根据所述标签信息获得对应所述标签信息的参考发音序列集;基于所述参考发音序列集对所述标签发音序列进行匹配,获得对应所述标签信息的匹配结果。应用本发明实施例提供的一种语音识别方法、设备及计算机可读存储介质,可以对输入语音的局部进行识别,得到局部N-best识别结果。
-
公开(公告)号:CN112037769B
公开(公告)日:2024-07-30
申请号:CN202010738406.5
申请日:2020-07-28
Applicant: 出门问问信息科技有限公司
IPC: G10L15/06 , G10L15/10 , G10L15/26 , G06F40/284
Abstract: 本发明公开了一种训练数据生成方法、装置以及计算机可读存储介质,包括:接收音频信息和对应的标注文本信息;生成对应于所述音频信息的语音识别文本信息和第一时间戳信息;内容匹配所述标注文本信息和语音识别文本信息,根据所述第一时间戳信息生成对应于所述标注文本信息的第二时间戳信息;根据所述第二时间戳信息,获取所述标注文本信息中的子文本训练信息和所述音频信息中的子音频训练信息。通过获取原始的音频信息以及标注文本信息,利用音频信息的时间戳信息从原始的音频信息以及标注文本信息中获取多个子音频训练信息和对应的子文本训练信息,从而得到大量并且高质量的语音训练数据,此过程效率高并且降低了耗费成本。
-
公开(公告)号:CN112037769A
公开(公告)日:2020-12-04
申请号:CN202010738406.5
申请日:2020-07-28
Applicant: 出门问问信息科技有限公司
IPC: G10L15/06 , G10L15/10 , G10L15/26 , G06F40/284
Abstract: 本发明公开了一种训练数据生成方法、装置以及计算机可读存储介质,包括:接收音频信息和对应的标注文本信息;生成对应于所述音频信息的语音识别文本信息和第一时间戳信息;内容匹配所述标注文本信息和语音识别文本信息,根据所述第一时间戳信息生成对应于所述标注文本信息的第二时间戳信息;根据所述第二时间戳信息,获取所述标注文本信息中的子文本训练信息和所述音频信息中的子音频训练信息。通过获取原始的音频信息以及标注文本信息,利用音频信息的时间戳信息从原始的音频信息以及标注文本信息中获取多个子音频训练信息和对应的子文本训练信息,从而得到大量并且高质量的语音训练数据,此过程效率高并且降低了耗费成本。
-
公开(公告)号:CN110276074B
公开(公告)日:2023-04-18
申请号:CN201910539080.0
申请日:2019-06-20
Applicant: 出门问问信息科技有限公司
IPC: G06F40/30 , G06F16/35 , G06F16/33 , G06F18/214 , G06F18/241 , G06N20/00
Abstract: 本公开提供了一种自然语言处理的分布式训练方法,包括:接收训练请求并且对训练请求进行处理;将包括训练数据及相应参数的处理后训练请求发送至消息队列中;从消息队列中获取训练请求,并且根据训练请求来选择不同的训练模型进行训练;将训练完成后的训练结果发送至预测流程树构建队列;以及从预测流程树构建队列中获取请求,进行流程树的生成或更新,并且上传生成的流程树或更新的流程树。本公开还提供了一种自然语言处理的分布式训练装置、电子设备及可读存储介质。
-
公开(公告)号:CN112053686A
公开(公告)日:2020-12-08
申请号:CN202010739039.0
申请日:2020-07-28
Applicant: 出门问问信息科技有限公司
Abstract: 本发明公开了一种音频中断方法、装置以及计算机可读存储介质,包括:获取音频数据的多个特征向量数据;针对多个所述特征向量数据,生成用于表征所述音频数据为特定音频的置信度;根据所生成的置信度,停止当前音频信息的输出。由此,通过利用特征向量数据所生成的置信度来决定停止当前音频信息的输出,不需要通过现有技术中语音识别解码器得到识别结果,大大减少了计算量,进而降低了打断的延迟,提升了用户体验。
-
公开(公告)号:CN110276074A
公开(公告)日:2019-09-24
申请号:CN201910539080.0
申请日:2019-06-20
Applicant: 出门问问信息科技有限公司
Abstract: 本公开提供了一种自然语言处理的分布式训练方法,包括:接收训练请求并且对训练请求进行处理;将包括训练数据及相应参数的处理后训练请求发送至消息队列中;从消息队列中获取训练请求,并且根据训练请求来选择不同的训练模型进行训练;将训练完成后的训练结果发送至预测流程树构建队列;以及从预测流程树构建队列中获取请求,进行流程树的生成或更新,并且上传生成的流程树或更新的流程树。本公开还提供了一种自然语言处理的分布式训练装置、电子设备及可读存储介质。
-
公开(公告)号:CN109800432A
公开(公告)日:2019-05-24
申请号:CN201910069651.9
申请日:2019-01-24
Applicant: 出门问问信息科技有限公司
Abstract: 本发明实施例公开了一种评估语义理解准确率的方法、装置、存储介质和电子设备。该语义理解准确率的方法包括:获得标准测试文件;调用被测试的当前正则表达式获得的当前测试意图分类;判断所述当前测试意图分类与标准用户意图的分类是否一致;统计所述当前测试意图分类与从标准用户意图的分类一致或不一致的概率。该方法只需要将一个标准测试文件维护好,即可评估当前测试意图分类是否准确,并及时修正正则表达式,从而提高正则表达式的准确率。
-
-
-
-
-
-
-