-
公开(公告)号:CN119964544A
公开(公告)日:2025-05-09
申请号:CN202411954295.6
申请日:2024-12-27
Applicant: 清华大学
IPC: G10L13/027 , G10L13/033 , G10L21/0308 , G10L25/30 , H04S1/00
Abstract: 本发明提供一种基于薛定谔桥的空间音频合成方法及系统,包括:获取单声道声源信号,基于所述单声道声源信号构建先验信号和带噪表征;将所述先验信号和带噪表征输入至预训练的空间音频合成模型,通过所述空间音频合成模型基于随机微分方程迭代式采样路径,生成最终的双声道空间音频;其中,所述空间音频合成模型是通过预定义的双声道薛定谔桥参数化目标和边界辅助监督对预设神经网络模型进行训练得到的。本发明解决了现有空间音频合成速度慢、质量不佳的问题。