使用自适应平滑的对话增强

    公开(公告)号:CN114503197A

    公开(公告)日:2022-05-13

    申请号:CN202080069218.6

    申请日:2020-08-26

    Inventor: 余雪梅

    Abstract: 一种增强音频信号中的对话可懂度的方法,其包括:确定音频内容包含语音内容的语音置信度分数;响应于所述语音置信度分数,确定所述音频内容包含音乐相关内容的音乐置信度分数;及应用所述音频信号的所选择的频带的用户所选择的增益,以获得对话增强音频信号。所述用户所选择的增益通过自适应平滑算法进行平滑,所述平滑算法中的过去帧的影响由平滑因子确定,所述平滑因子响应于所述音乐置信度分数而计算,且针对具有相对较高音乐置信度分数的内容具有相对较高的值,且针对具有相对较低音乐置信度分数的语音内容具有相对较低的值,以便增加过去帧对音乐相关内容的对话增强的影响。

    使用自适应平滑的对话增强

    公开(公告)号:CN114503197B

    公开(公告)日:2023-06-13

    申请号:CN202080069218.6

    申请日:2020-08-26

    Inventor: 余雪梅

    Abstract: 一种增强音频信号中的对话可懂度的方法,其包括:确定音频内容包含语音内容的语音置信度分数;响应于所述语音置信度分数,确定所述音频内容包含音乐相关内容的音乐置信度分数;及应用所述音频信号的所选择的频带的用户所选择的增益,以获得对话增强音频信号。所述用户所选择的增益通过自适应平滑算法进行平滑,所述平滑算法中的过去帧的影响由平滑因子确定,所述平滑因子响应于所述音乐置信度分数而计算,且针对具有相对较高音乐置信度分数的内容具有相对较高的值,且针对具有相对较低音乐置信度分数的语音内容具有相对较低的值,以便增加过去帧对音乐相关内容的对话增强的影响。

    音频的双耳化的操控
    3.
    发明公开

    公开(公告)号:CN114503607A

    公开(公告)日:2022-05-13

    申请号:CN202080066026.X

    申请日:2020-08-19

    Abstract: 本公开提供一种用于操控音频的双耳化的方法。所述方法包括以下步骤:接收(410)音频输入信号,计算(430)指示所述音频输入信号的当前音频帧包括经双耳化音频的可能性的置信度值;基于所述置信度值来确定(450)状态信号;基于所述第一置信度值、所述状态信号及所述音频帧的能量值来确定(460)操控信号;及通过根据所述操控信号处理所述音频输入信号来产生(470)具有经操控双耳化的音频输出信号。

    头部跟踪数据的同步
    4.
    发明公开

    公开(公告)号:CN119856517A

    公开(公告)日:2025-04-18

    申请号:CN202380065485.X

    申请日:2023-09-07

    Abstract: 提供了用于利用头部跟踪数据的方法、系统和介质。在一些实施例中,一种方法涉及在一对通信地耦接的耳塞式耳机中的每个耳塞式耳机处接收来自一个或多个传感器的传感器数据。该方法可以涉及在这对通信地耦接的耳塞式耳机中的每个耳塞式耳机处确定头部取向信息。该方法可以涉及在这对通信地耦接的耳塞式耳机之间传输所确定的头部取向信息,使得主耳塞式耳机将由主耳塞式耳机确定的头部取向信息发送到从耳塞式耳机。该方法可以涉及在每个耳塞式耳机处至少部分地基于与曾传输头部取向信息的时间戳相关联的定时信息来同步所确定的头部取向数据。该方法可以涉及利用同步后的头部取向数据来由这对通信地耦接的耳塞式耳机中的每个耳塞式耳机呈现音频内容。

    经头部跟踪调整的双耳音频
    5.
    发明公开

    公开(公告)号:CN118235432A

    公开(公告)日:2024-06-21

    申请号:CN202280071331.7

    申请日:2022-10-07

    Inventor: 郝宇星 余雪梅

    Abstract: 本公开涉及一种用于生成双耳音频信号对(LB,RB)的方法和音频处理系统(1)。该方法包括获得(S1a)音频呈现的输入音频信号对(L,R),对输入音频信号(L,R)执行上混(S2)以生成三个去相关音频信号(LD,RD,CD),每个去相关音频信号在收听位置上具有入射方向(41,42,43)。该方法进一步包括对于每个去相关音频信号,基于去相关音频信号(LD,RD,CD)的入射方向、头部相关传输模型和头部旋转信息来确定耳间差值对。该方法进一步包括基于三个去相关音频信号(LD,RD,CD)和耳间差值来生成(S4)双耳音频信号对(LB,RB)。

    音频内容的定制的双耳渲染
    7.
    发明公开

    公开(公告)号:CN119156837A

    公开(公告)日:2024-12-17

    申请号:CN202380038575.X

    申请日:2023-05-03

    Abstract: 提供了用于处理音频的方法、系统、以及介质。在一些实施例中,用于处理音频的方法可以涉及接收立体声音频信号。所述方法可以涉及将所述立体声音频信号分离成导向信号和扩散信号。所述方法可以涉及基于当前收听情境确定一个或更多个扩散信号修改参数,其中所述一个或更多个扩散信号修改参数指示要被重新分配给输出多声道信号中的一个或更多个输出声道的所述扩散信号的比例或者要被应用到所述扩散信号的衰减的程度。所述方法可以涉及基于所述导向信号、所述扩散信号、以及所述一个或更多个扩散信号修改参数生成所述输出多声道信号。所述方法可以涉及将所述输出多声道信号提供给虚拟器以用于渲染为双耳音频信号以供在可穿戴设备上播放。

Patent Agency Ranking