多通道音频信号的生成
    1.
    发明公开

    公开(公告)号:CN119866523A

    公开(公告)日:2025-04-22

    申请号:CN202380065833.3

    申请日:2023-08-29

    Abstract: 一种音频装置包括接收器(101),所述接收器被布置为接收针对多通道音频信号的下混音频信号和用于对所述下混音频信号进行上混的上混参数数据。第一人工神经网络(107)根据所述下混音频信号的样本来生成针对所述下混音频信号的特征值的集合。第二人工神经网络(109)具有接收所述下混音频信号的第二样本的输入节点和接收来自所述特征值的集合的特征值的节点。基于这些输入,所述第二人工神经网络(109)针对所述下混音频信号生成针对辅助音频信号的样本。生成器(105)依据上混参数数据来根据下混信号和辅助音频信号生成多通道音频信号。在许多实施例中,操作可以基于子带,其中单独的人工神经网络用于不同的子带。

    对多声道音频信号和表示多声道音频信号的数据信号的生成

    公开(公告)号:CN119856221A

    公开(公告)日:2025-04-18

    申请号:CN202380065511.9

    申请日:2023-09-06

    Abstract: 一种音频装置包括接收机(101),其被布置为接收数据信号,所述数据信号包括针对多声道音频信号的下混音频信号、用于对所述下混音频信号进行上混的上混参数化数据以及控制数据值集合。人工神经网络(107)具有用于接收下混音频信号的第二样本的输入节点和用于接收来自控制数据值集合的控制数据值的节点。基于这些输入,人工神经网络(107)生成用于下混音频信号的辅助音频信号的样本。生成器(105)根据上混参数化数据,从下混信号和辅助信号生成多声道音频信号。另一装置可以使用另一人工神经网络生成控制数据值集合,所述另一人工神经网络具有用于接收所述多声道音频信号的下混的输入节点。在许多实施例中,操作可以是基于子带的,其中单独的人工神经网络用于不同子带。

    估计受试者的身体或身体部位的表面积和/或体积

    公开(公告)号:CN113874913A

    公开(公告)日:2021-12-31

    申请号:CN202080037911.5

    申请日:2020-05-20

    Abstract: 根据一个方面,提供了一种用于估计受试者的身体或身体部位的表面积和/或体积的计算机实现的方法。该方法包括:获得至少一个图像,其中该至少一个图像包括受试者的面部;处理该至少一个图像以确定受试者面部的一个或多个面部图像参数的值;确定受试者的一个或多个特性的值,其中该一个或多个特性包括以下一项或多项:受试者的年龄、受试者的体重、受试者的身高和受试者的性别;使用面部参数模型和所确定的一个或多个面部图像参数的值来确定受试者面部的一个或多个面部形状参数的值,其中面部参数模型将一个或多个面部图像参数的具体值与具有一个或多个面部形状参数的相应值的面部的相应3D表示相关联;利用所确定的一个或多个特性的值和所确定的一个或多个面部形状参数的值,使用预测模型,来预测受试者的全身的3D表示;以及分析所预测的受试者的全身的3D表示以估计受试者的身体或身体部位的表面积和/或体积。还提供了对应装置和计算机程序产品。

    多声道音频信号的生成
    4.
    发明公开

    公开(公告)号:CN119895492A

    公开(公告)日:2025-04-25

    申请号:CN202380065510.4

    申请日:2023-09-05

    Abstract: 一种音频装置包括接收机(101),其被布置为接收数据信号,所述数据信号包括针对多声道音频信号的下混音频信号、用于对所述下混音频信号进行上混的上混参数化数据以及上混参数化数据。子带生成器(103)生成下混音频信号的频率子带信号,以及参数生成器(105)生成上混参数值集合。神经网络布置(107,401)包括接收上混参数值以及至少一个频率子带信号的样本的多个子带人工神经网络(107,401)。子带人工神经网络(107,401)生成针对多声道音频信号的频率子带表示的子带的子带样本。

Patent Agency Ranking