一种语音识别方法及装置
    1.
    发明公开

    公开(公告)号:CN117392984A

    公开(公告)日:2024-01-12

    申请号:CN202311533155.7

    申请日:2023-11-16

    Inventor: 苏传志 刘明 李雪

    Abstract: 本申请公开了一种语音识别方法及装置,该语音识别方法包括:获取待识别的语音信息;对所述待识别的语音信息进行分段处理,获得分段处理结果,其中,所述分段处理结果至少包括:人物序号及起止时间戳;基于所述分段处理结果,对所述待识别的语音信息进行拼接,获得语音组合结果,所述语音组合结果包括多个人物序号分别对应的语音组合信息;对所述语音组合结果进行声纹识别,确定所述语音组合结果对应的人物身份;将所述语音组合结果的文字提取结果与所述语音组合结果对应的人物身份进行绑定,获得语音识别结果。

    多媒体文件数据处理方法及装置
    2.
    发明公开

    公开(公告)号:CN116089750A

    公开(公告)日:2023-05-09

    申请号:CN202211601114.2

    申请日:2022-12-13

    Abstract: 本发明公开了一种多媒体文件数据处理方法及装置,用以解决音频校正文字的过程中,文字无法实现更精确地校正,准确性不高的技术问题。其中,该方法包括获取多媒体文件;根据多媒体文件,生成对应多媒体文件的字符集合;在多媒体文件的多媒体帧和作为字符集合的元素的字符之间,建立一一映射关系,以便校正对应多媒体帧对应的字符。基于业务需求,在音频校正文字的过程中,可以以更小的单元实时校正对应多媒体帧对应的字符,减小页面校正过程中的困难,提高校正过程中的准确率。

Patent Agency Ranking