-
公开(公告)号:CN119317957A
公开(公告)日:2025-01-14
申请号:CN202280096502.1
申请日:2022-06-14
Applicant: 微软技术许可有限责任公司
Abstract: 描述了用于编码和解码诸如音频数据的信号的技术和解决方案。所公开的创新可以特别用于语音编解码应用,诸如用于实时通信。使用神经网络,上下文编解码可以用于使用来自过去帧的重建的潜在特征的预测作为上下文来针对当前帧编码潜在特征。提取器基于这种预测和使用编码器获得的当前帧的潜在特征来学习类残差特征。然后量化类残差特征。在编解码框架的解码器部分,量化特征被去量化,然后与来自先前重建的潜在特征的预测组合以提供当前帧的重建特征,然后可以由解码器处理该重建特征以提供重建信号。