Patent search ap:("微软技术许可有限责任公司") AND inv:"王晓强" Page 1

1.

发明公开
用于自动语音识别(ASR)的上下文拼写校正(CSC) 审中-实审

公开(公告)号：CN116057534A

公开(公告)日：2023-05-02

申请号：CN202180052809.7

申请日：2021-06-15

Applicant: 微软技术许可有限责任公司

Inventor： 王晓强 , 刘砚清 , 赵晟 , 李锦宇

IPC: G06F40/295

Abstract: 用于语音识别的新颖解决方案提供了用于自动语音识别(ASR)的上下文拼写校正(CSC)。所公开的示例包括：接收音频流；对该音频流执行ASR处理以产生ASR假设；接收上下文列表；以及至少基于该ASR假设和该上下文列表来执行拼写校正以产生输出文本序列。在ASR模型之上使用上下文拼写校正(CSC)模型，这排除了改变原始ASR模型的需要。这准许基于上下文数据的运行时用户定制，即使对于大型上下文列表也是如此。一些示例包括过滤针对音频流的ASR假设，并且至少基于ASR假设过滤来确定是否要触发针对该ASR假设的拼写校正。一些示例包括使用具有上下文短语的经预处理转录来生成文本到语音(TTS)音频，以训练CSC模型。

Patent Agency Ranking