单通道音乐人声分离中的多种特定乐器强化分离方法

    公开(公告)号:CN105070301B

    公开(公告)日:2018-11-27

    申请号:CN201510409132.4

    申请日:2015-07-14

    Applicant: 福州大学

    Abstract: 本发明涉及一种单通道音乐人声分离中的多种特定乐器强化分离方法。该方法对电吉他、单簧管、小提琴、钢琴、木吉他、风琴、长笛和小号共计8种乐器进行强化分离,该强化分离是通过一层单乐器分离器和三层多乐器组合强化器实现,其中,第一层多乐器组合强化器能够分离2类乐器声,第二层多乐器组合强化器能够分离4类乐器声,第三层多乐器组合强化器能够分离8类乐器声。本发明利用DRNN作为单乐器分离器的核心,为不同的单乐器分离器建立不同的DRNN模型;同时,采用BP网络作为多乐器分离器的核心来实现多乐器的分离;最后,提出了针对该系统不同的单乐器分离器的训练样本的构建方法,本发明方法简单灵活,具有较强的实用性。

    一种基于视觉主观感受的视频源切换方法

    公开(公告)号:CN104092960B

    公开(公告)日:2017-06-06

    申请号:CN201410358511.0

    申请日:2014-07-26

    Applicant: 福州大学

    Abstract: 本发明涉及一种基于视觉主观感受的视频源切换方法,其特征在于:服务器端通过训练获取视觉主观感受预测器NMSVM,并将该视觉主观感受预测器NMSVM分发至客户端,客户端对视觉主观感受预测器NMSVM进行部署;客户端通过多项式拟合预测当前网络服务状态下一阶段可能的网络视频丢包率;客户端通过差分自回归移动平均方法预测当前视频源下一阶段可能的视频内容视觉特性;客户端通过视觉主观感受预测器NMSVM对当前视频源下一阶段的视觉主观感受进行预测,并根据预测结果决定是否需要切换视频源格式。本发明综合考虑网络丢包率、视频源格式、视频内容特性等因素,实现了网络流媒体服务不间断下的视频源格式无缝切换,方法简单灵活,具有较强的实用性。

    基于空域复杂度的无参考视频质量评价方法

    公开(公告)号:CN103108210B

    公开(公告)日:2015-04-15

    申请号:CN201310072793.3

    申请日:2013-03-07

    Applicant: 福州大学

    Abstract: 本发明涉及一种基于空域复杂度的无参考视频质量评价方法,通过码流感知查找并标记受丢包影响的宏块(Damaged块),并计算每帧图像的空域复杂度,在Damaged块的基础上结合图像的空域复杂度来计算每帧图像的质量,最后考虑人眼的视觉特征结合每帧图像的质量得到视频的质量,本发明的方法简单,实现灵活而且效率高。

    基于视频质量评估的视频自适应传输方法

    公开(公告)号:CN103024431B

    公开(公告)日:2015-03-04

    申请号:CN201210530061.X

    申请日:2012-12-11

    Applicant: 福州大学

    Abstract: 本发明涉及一种基于视频质量评估的视频自适应传输方法,一种基于视频质量评估的视频自适应传输方法,其特征在于:通过评价客户端得到的视频的质量来动态调整服务器发送视频数据的速率,使得客户端接收到的视频的质量得到有效的改善;若视频的质量大于3000,则客户端发生请求给服务器,请求服务器提高发送视频数据的速率,使得客户端接收到的视频的质量得到改善;若视频的质量小于或者等于3000,则客户端与服务器不做交互。本发明的方法简单,实现灵活而且效率高。

    单通道音乐人声分离中的多种特定乐器强化分离方法

    公开(公告)号:CN105070301A

    公开(公告)日:2015-11-18

    申请号:CN201510409132.4

    申请日:2015-07-14

    Applicant: 福州大学

    Abstract: 本发明涉及一种单通道音乐人声分离中的多种特定乐器强化分离方法。该方法对电吉他、单簧管、小提琴、钢琴、木吉他、风琴、长笛和小号共计8种乐器进行强化分离,该强化分离是通过一层单乐器分离器和三层多乐器组合强化器实现,其中,第一层多乐器组合强化器能够分离2类乐器声,第二层多乐器组合强化器能够分离4类乐器声,第三层多乐器组合强化器能够分离8类乐器声。本发明利用DRNN作为单乐器分离器的核心,为不同的单乐器分离器建立不同的DRNN模型;同时,采用BP网络作为多乐器分离器的核心来实现多乐器的分离;最后,提出了针对该系统不同的单乐器分离器的训练样本的构建方法,本发明方法简单灵活,具有较强的实用性。

    一种基于深度信念网络的单通道音乐的歌声分离方法

    公开(公告)号:CN104464727A

    公开(公告)日:2015-03-25

    申请号:CN201410755098.1

    申请日:2014-12-11

    Applicant: 福州大学

    Abstract: 本发明涉及一种基于深度信念网络的单通道音乐的歌声分离方法:先利用深度信念网络(DBN)抽取出有利于伴奏声和歌声的分离的高层抽象特征,紧接着利用Back-Propagation 神经网络分离出伴奏声和歌声的特征,最后利用重叠相加法得到时域的伴奏声和歌声信号。该方法将待分离的混合音乐分成很短的片段,从而弥补DBN在处理不同时间尺度音乐信号上的缺陷,同时利用了DBN的快速抽取高层抽象特征能力抽取出有利于分离出人声和伴奏声的高层抽象特征。最后考虑到由于单通道音乐信号是属于高维数据,在处理高维输入和高维输出问题上神经网络有着其特有的处理能力,所以选择使用BP神经网络作为最后的人声和伴奏声的分离器。该方法简单灵活,具有较强的实用性。

    基于空域复杂度的无参考视频质量评价方法

    公开(公告)号:CN103108210A

    公开(公告)日:2013-05-15

    申请号:CN201310072793.3

    申请日:2013-03-07

    Applicant: 福州大学

    Abstract: 本发明涉及一种基于空域复杂度的无参考视频质量评价方法,通过码流感知查找并标记受丢包影响的宏块(Damaged块),并计算每帧图像的空域复杂度,在Damaged块的基础上结合图像的空域复杂度来计算每帧图像的质量,最后考虑人眼的视觉特征结合每帧图像的质量得到视频的质量,本发明的方法简单,实现灵活而且效率高。

    一种时空联合的无参考视频质量检测方法

    公开(公告)号:CN103391450B

    公开(公告)日:2015-07-01

    申请号:CN201310292740.2

    申请日:2013-07-12

    Applicant: 福州大学

    Abstract: 本发明涉及一种时空联合的无参考视频质量检测方法,通过码流感知评价由丢包引发的视频质量损伤,考虑视频的时域特性和空域特性,并将时域和空域联合,从而来评价图像质量,最后考虑人眼的视觉特征结合每帧图像的质量得到视频的质量,本发明的方法简单,实现灵活而且效率高。

    一种基于视觉主观感受的视频源切换方法

    公开(公告)号:CN104092960A

    公开(公告)日:2014-10-08

    申请号:CN201410358511.0

    申请日:2014-07-26

    Applicant: 福州大学

    Abstract: 本发明涉及一种基于视觉主观感受的视频源切换方法,其特征在于:服务器端通过训练获取视觉主观感受预测器NMSVM,并将该视觉主观感受预测器NMSVM分发至客户端,客户端对视觉主观感受预测器NMSVM进行部署;客户端通过多项式拟合预测当前网络服务状态下一阶段可能的网络视频丢包率;客户端通过差分自回归移动平均方法预测当前视频源下一阶段可能的视频内容视觉特性;客户端通过视觉主观感受预测器NMSVM对当前视频源下一阶段的视觉主观感受进行预测,并根据预测结果决定是否需要切换视频源格式。本发明综合考虑网络丢包率、视频源格式、视频内容特性等因素,实现了网络流媒体服务不间断下的视频源格式无缝切换,方法简单灵活,具有较强的实用性。

    基于视频质量评估的视频自适应传输策略

    公开(公告)号:CN103024431A

    公开(公告)日:2013-04-03

    申请号:CN201210530061.X

    申请日:2012-12-11

    Applicant: 福州大学

    Abstract: 本发明涉及一种基于视频质量评估的视频自适应传输策略,一种基于视频质量评估的视频自适应传输策略,其特征在于:通过评价客户端得到的视频的质量来动态调整服务器发送视频数据的速率,使得客户端接收到的视频的质量得到有效的改善;若视频的质量大于3000,则客户端发生请求给服务器,请求服务器提高发送视频数据的速率,使得客户端接收到的视频的质量得到改善;若视频的质量小于或者等于3000,则客户端与服务器不做交互。本发明的方法简单,实现灵活而且效率高。

Patent Agency Ranking