-
公开(公告)号:CN114530158B
公开(公告)日:2025-01-28
申请号:CN202011322186.4
申请日:2020-11-23
Applicant: 南京大学
IPC: G10L21/007
Abstract: 本发明涉及一种声效处理系统和方法。分别为低阶声线计算器和高阶声线计算器配置对应的计算阶数;根据声源位置追踪信息分别输入低阶声线计算器和高阶声线计算器进行计算获得各声线数据;声线分解输出器根据低阶声线计算器和高阶声线计算器提供的声线数据对声线进行分解处理,获得声线长度不同的声线数据子集A和声线数据子集B;分别计算各声线对应的扬声器音频驱动信号,经混合后获得完整的扬声器音频驱动信号。本发明同时实现较大声线追踪数量和较小的计算延迟。
-
公开(公告)号:CN117313308A
公开(公告)日:2023-12-29
申请号:CN202310766547.1
申请日:2023-06-27
Applicant: 南京大学
Abstract: 一种虚拟厅堂声效中早期反射声的渲染方法及系统,包括以下步骤:步骤1,对虚拟厅堂进行二维墙面建模,俯视方向看形成一个完全闭合的侧墙曲线,完全闭合的侧墙曲线中心点为原点;步骤2,在步骤1建模基础上,在俯视方向上,将虚拟厅堂划分多个用于计算的区域,包括:听音区和聚合声源分区,在每个聚合声源分区选定聚合声源位置;步骤3,按步骤2的区域划分,将真实声源聚合成虚拟的分区聚合声源;步骤4,对步骤3获得的分区聚合声源进行镜像声源计算,得出其对应的镜像声源;步骤5,使用步骤4获得的镜像声源对早期反射声进行渲染。本发明通过空间聚合镜像声源,不需要实时镜像声源计算和更新位置参数,实现了运算量的降低。
-
公开(公告)号:CN116740450A
公开(公告)日:2023-09-12
申请号:CN202310726324.2
申请日:2023-06-19
Applicant: 南京大学
IPC: G06V10/764 , G06V10/77 , G06V10/40 , G06V10/82 , G06V10/80 , G06N3/0464 , G06N3/045 , G06N3/084 , G06N3/096
Abstract: 一种基于联邦迁移学习的音视频匹配方法及系统,本发明所述方法基于大量情感数据,训练出预训练模型,个人用户在预训练模型上基于联邦迁移学习,使用少量个人数据,即可获得适用于自己需求的音视频匹配模型。本发明训练过程中数据隔离,解决了音视频匹配中可能存在的数据泄露风险,保障了用户的版权和隐私。同时保证了模型的质量无损传输,不会出现负迁移。
-
公开(公告)号:CN119767206A
公开(公告)日:2025-04-04
申请号:CN202411922435.1
申请日:2024-12-25
Applicant: 南京大学
IPC: H04R3/00
Abstract: 本发明公开了一种扬声器相位均衡信号处理系统及其极点参数确定方法,将扬声器相位响应在设定的均衡频率范围内均衡为线性相位,所述系统包括级联的相位调控器和群延时均衡器;所述相位调控器为一阶IIR全通滤波器;所述群延时均衡器包括S个级联的低阶IIR全通滤波器,其中前N1个为低阶因果IIR全通滤波器,后N2个为低阶非因果IIR全通滤波器。本发明通过低运算复杂度的全通滤波器及其参数,均衡扬声器的相位,可以显著降低低频相位均衡所需的计算量、提升扬声器相位响应的线性程度,从而提升音质,改善听感。
-
-
公开(公告)号:CN105203198A
公开(公告)日:2015-12-30
申请号:CN201510587118.3
申请日:2015-09-15
Applicant: 南京大学
IPC: G01H7/00
Abstract: 一种混响室混响时间测量方法,将至少一个声源和至少一个传声器置于房间的不同的顶角位置,仅对此单一测点进行测量,测量结果即为房间混响时间的最终结果。至少一个声源和至少一个传声器是安装在混响室的面对角或体对角。声源置于角点,可充分激发所有简正模态。将传声器置于另一角点可等权重的收集各模态驻波的信息,得到的混响时间测量结果拥有较好的代表性和更高的置信度。在同等测结果置信度的要求下,相比现有测量方法减少了测点数量,降低测量复杂度和测量工作量。
-
公开(公告)号:CN118338193A
公开(公告)日:2024-07-12
申请号:CN202410236911.8
申请日:2024-03-01
Applicant: 南京大学
Abstract: 本发明公开了一种传声增益的推定方法及系统,所述方法包括:测量被测扩声系统的总反馈路径,所述总反馈路径指被测扩声系统开环传递函数;构建基于所述总反馈路径的被测扩声系统的声反馈环路模型;基于所述声反馈环路模型和所述总反馈路径,推定被测扩声系统的临界环路增益最终值,进而得到最高可用增益下被测扩声系统带有声反馈的冲激响应;测量测点处房间冲激响应,并与带有声反馈的冲激响应结合,推定得到传声增益。本发明实现了无啸叫情况下对传声增益的推定,可有效避免现有技术中直接测量传声增益和现有仿真技术进行临界环路增益推定时带来的生理不适。
-
公开(公告)号:CN116778291A
公开(公告)日:2023-09-19
申请号:CN202310742204.1
申请日:2023-06-21
Applicant: 南京大学
IPC: G06V10/80 , G06V10/774 , G06V20/40 , G10L25/63
Abstract: 一种基于视听融合效应的音视频跨模态搜索方法,对于用户给出的音频或视频,本发明可以通过训练好的人工智能网络,进行跨模态的搜索,即通过音频搜索视频或通过视频搜索音频。对于输入的其进行情感特征的提取,并以特征向量的余弦距离在素材库中进行搜索。本发明可以适配目前常见音视频格式的要求,内容上视频适用场景包括电影、纪录片、广告片等,音频适用场景包括古典乐、流行乐、爵士乐等。
-
-
公开(公告)号:CN114530158A
公开(公告)日:2022-05-24
申请号:CN202011322186.4
申请日:2020-11-23
Applicant: 南京大学
IPC: G10L21/007
Abstract: 本发明涉及一种声效处理系统和方法。分别为低阶声线计算器和高阶声线计算器配置对应的计算阶数;根据声源位置追踪信息分别输入低阶声线计算器和高阶声线计算器进行计算获得各声线数据;声线分解输出器根据低阶声线计算器和高阶声线计算器提供的声线数据对声线进行分解处理,获得声线长度不同的声线数据子集A和声线数据子集B;分别计算各声线对应的扬声器音频驱动信号,经混合后获得完整的扬声器音频驱动信号。本发明同时实现较大声线追踪数量和较小的计算延迟。
-
-
-
-
-
-
-
-
-