一种音频中断方法、装置以及计算机可读存储介质

    公开(公告)号:CN112053686B

    公开(公告)日:2024-01-02

    申请号:CN202010739039.0

    申请日:2020-07-28

    Abstract: 本发明公开了一种音频中断方法、装置以及计算机可读存储介质,包括:获取音频数据的多个特征向量数据;针对多个所述特征向量数据,生成用于表征所述音频数据为特定音频的置信度;根据所生成的置信度,停止当前音频信息的输出。由此,通过利用特征向量数据所生成的置信度来决定停止当前音频信息的输出,不需要通过现有技术中语音识别解码器得到识别结果,大大减少了计算量,进而降低了打断的延迟,提升了用户体验。

    一种语音识别方法、设备及计算机可读存储介质

    公开(公告)号:CN111312226A

    公开(公告)日:2020-06-19

    申请号:CN202010096208.3

    申请日:2020-02-17

    Inventor: 陈晓宇

    Abstract: 本发明公开了一种语音识别方法、设备及计算机可读存储介质,所述方法包括:根据语音识别结果获得标签信息;基于所述标签信息确定标签发音序列;根据所述标签信息获得对应所述标签信息的参考发音序列集;基于所述参考发音序列集对所述标签发音序列进行匹配,获得对应所述标签信息的匹配结果。应用本发明实施例提供的一种语音识别方法、设备及计算机可读存储介质,可以对输入语音的局部进行识别,得到局部N-best识别结果。

    一种训练数据生成方法、装置以及计算机可读存储介质

    公开(公告)号:CN112037769B

    公开(公告)日:2024-07-30

    申请号:CN202010738406.5

    申请日:2020-07-28

    Abstract: 本发明公开了一种训练数据生成方法、装置以及计算机可读存储介质,包括:接收音频信息和对应的标注文本信息;生成对应于所述音频信息的语音识别文本信息和第一时间戳信息;内容匹配所述标注文本信息和语音识别文本信息,根据所述第一时间戳信息生成对应于所述标注文本信息的第二时间戳信息;根据所述第二时间戳信息,获取所述标注文本信息中的子文本训练信息和所述音频信息中的子音频训练信息。通过获取原始的音频信息以及标注文本信息,利用音频信息的时间戳信息从原始的音频信息以及标注文本信息中获取多个子音频训练信息和对应的子文本训练信息,从而得到大量并且高质量的语音训练数据,此过程效率高并且降低了耗费成本。

    一种训练数据生成方法、装置以及计算机可读存储介质

    公开(公告)号:CN112037769A

    公开(公告)日:2020-12-04

    申请号:CN202010738406.5

    申请日:2020-07-28

    Abstract: 本发明公开了一种训练数据生成方法、装置以及计算机可读存储介质,包括:接收音频信息和对应的标注文本信息;生成对应于所述音频信息的语音识别文本信息和第一时间戳信息;内容匹配所述标注文本信息和语音识别文本信息,根据所述第一时间戳信息生成对应于所述标注文本信息的第二时间戳信息;根据所述第二时间戳信息,获取所述标注文本信息中的子文本训练信息和所述音频信息中的子音频训练信息。通过获取原始的音频信息以及标注文本信息,利用音频信息的时间戳信息从原始的音频信息以及标注文本信息中获取多个子音频训练信息和对应的子文本训练信息,从而得到大量并且高质量的语音训练数据,此过程效率高并且降低了耗费成本。

    一种音频中断方法、装置以及计算机可读存储介质

    公开(公告)号:CN112053686A

    公开(公告)日:2020-12-08

    申请号:CN202010739039.0

    申请日:2020-07-28

    Abstract: 本发明公开了一种音频中断方法、装置以及计算机可读存储介质,包括:获取音频数据的多个特征向量数据;针对多个所述特征向量数据,生成用于表征所述音频数据为特定音频的置信度;根据所生成的置信度,停止当前音频信息的输出。由此,通过利用特征向量数据所生成的置信度来决定停止当前音频信息的输出,不需要通过现有技术中语音识别解码器得到识别结果,大大减少了计算量,进而降低了打断的延迟,提升了用户体验。

    评估语义理解准确率的方法、装置、存储介质和电子设备

    公开(公告)号:CN109800432A

    公开(公告)日:2019-05-24

    申请号:CN201910069651.9

    申请日:2019-01-24

    Inventor: 陈晓宇 高雅濛

    Abstract: 本发明实施例公开了一种评估语义理解准确率的方法、装置、存储介质和电子设备。该语义理解准确率的方法包括:获得标准测试文件;调用被测试的当前正则表达式获得的当前测试意图分类;判断所述当前测试意图分类与标准用户意图的分类是否一致;统计所述当前测试意图分类与从标准用户意图的分类一致或不一致的概率。该方法只需要将一个标准测试文件维护好,即可评估当前测试意图分类是否准确,并及时修正正则表达式,从而提高正则表达式的准确率。

Patent Agency Ranking