一种基于序列建模的流式语音识别方法

    公开(公告)号:CN118571215A

    公开(公告)日:2024-08-30

    申请号:CN202410758231.2

    申请日:2024-06-13

    Applicant: 南京大学

    Abstract: 本发明公开一种基于序列建模的流式语音识别方法,从持续的语音流中收集不同种类的语音数据;利用语音数据进行序列建模训练,以构建一个能够处理序列数据和捕捉长距离依赖的语音识别模型。在此过程中,动态监控并调度计算资源,确保模型训练和数据处理的资源需求得到满足,从而优化整体运行效率。当引入新种类的语音数据时,通过序列建模技术,构建先前语音数据与新类别语音数据之间的映射关系。在更新和优化模型的阶段,再次评估并调整资源分配。本发明解决了在实时语音流中新旧语音数据持续变化的挑战,并克服了仅依靠现有模型与新收集语音数据构建新模型的限制,减少了实施过程中的资源消耗,提高了系统的适应性和灵活性。

Patent Agency Ranking