一种视频去噪的方法和设备

    公开(公告)号:CN111212198B

    公开(公告)日:2022-04-08

    申请号:CN201811399755.8

    申请日:2018-11-22

    Abstract: 本发明公开了一种视频去噪的方法和设备,用以解决现有技术中在视频去噪后视频感知质量差的问题。本发明将接收到的待去噪视频分割成多个去噪视频的GOP,并根据去噪视频的GOP的第一质量值确定待去噪视频的第二质量值;根据待去噪视频的第二质量值确定稀疏表示阈值;将稀疏表示阈值和待去噪视频的像素值输入训练联合字典,以对待去噪视频进行稀疏表示去噪;其中,其中,训练联合字典为视频空域训练集和视频时域训练集采用KSVD方法训练的联合字典。由于本发明不仅对空域噪声进行了去噪处理,还对时域噪声进行了去噪处理,不仅保证了待去噪视频中每帧图像的质量,还保证视频不会产生抖动和闪烁等问题,提升视频的整体感知质量。

    多方视频混屏方法、装置、网络设备及存储介质

    公开(公告)号:CN110855908B

    公开(公告)日:2022-09-27

    申请号:CN201911128504.0

    申请日:2019-11-18

    Abstract: 本发明实施方式涉及通信技术领域,公开了一种多方视频混屏方法,该方法包括:获取待混屏的N个视频的编码帧和每个视频的输入帧率,N为大于1的自然数;将输入帧率与预设帧率不同的视频的编码帧进行解码得到解码帧,并获取输入帧率与预设帧率不同的视频的特征参数;将特征参数输入至运动复杂度模型,得到输入帧率与预设帧率不同的视频的运动复杂度;根据预设帧率和运动复杂度对解码帧进行插帧或抛帧处理,得到处理后的解码帧;根据处理后的解码帧合成混屏视频。本发明实施方式还提供了一种多方视频混屏装置、网络设备及存储介质。本发明实施方式提供的多方视频混屏方法、装置、网络设备及存储介质,可以提高混屏的通信视频的显示效果。

    一种通信会话控制方法及装置

    公开(公告)号:CN111355919A

    公开(公告)日:2020-06-30

    申请号:CN201811580965.7

    申请日:2018-12-24

    Abstract: 本发明涉及通信技术领域,尤其涉及一种通信会话控制方法及装置,获取通信会话中任意一个参与者的音频数据;判断所述任意一个参与者是否为静音状态,若确定为静音状态,则进一步判断是否为所述通信会话中预设管理方将所述任意一个参与者设置为静音状态;若确定不是,则将所述任意一个参与者的音频数据发送给除将其设置为静音状态的参与者之外的其他参与者,这样,不仅可以将静音权限赋予给通信会话中更多的参与者,能够对嘈杂参与者快速静音,提高通信会话的质量,并且还将静音权限进行细分,若不是管理方将某参与者静音,则只有将其设置为静音状态的参与者不能接收其音频数据,可以减少通信会话中的不可控行为,提高通信会话可靠性和质量。

    一种通信会话控制方法及装置

    公开(公告)号:CN111355919B

    公开(公告)日:2021-05-25

    申请号:CN201811580965.7

    申请日:2018-12-24

    Abstract: 本发明涉及通信技术领域,尤其涉及一种通信会话控制方法及装置,获取通信会话中任意一个参与者的音频数据;判断所述任意一个参与者是否为静音状态,若确定为静音状态,则进一步判断是否为所述通信会话中预设管理方将所述任意一个参与者设置为静音状态;若确定不是,则将所述任意一个参与者的音频数据发送给除将其设置为静音状态的参与者之外的其他参与者,这样,不仅可以将静音权限赋予给通信会话中更多的参与者,能够对嘈杂参与者快速静音,提高通信会话的质量,并且还将静音权限进行细分,若不是管理方将某参与者静音,则只有将其设置为静音状态的参与者不能接收其音频数据,可以减少通信会话中的不可控行为,提高通信会话可靠性和质量。

    一种回声路径延迟估计方法及装置

    公开(公告)号:CN111223492A

    公开(公告)日:2020-06-02

    申请号:CN201811405778.5

    申请日:2018-11-23

    Abstract: 本发明公开了一种回声路径延迟估计方法及装置,回声路径延迟估计装置通过执行回声路径延迟估计方法,包括:对输入信号进行预处理获取预处理后的语音信号;对预处理后的语音信号进行时频转换获取频域信号;获取所述频域信号的特征参数,其中,所述特征参数包括噪声阈值、所述近端语音信号的傅里叶变换值、所述远端语音信号的傅里叶变换值、长时能量值和短时能量值;将所述特征参数输入所述深度学习回声路径延迟估计模型,获取回声路径的延迟估计值。从而解决现有技术中存在的现有的回声消除算法中的回声路径延迟估计方法具有局限性,无法适用于不同的回声环境的技术问题。

    一种降噪方法及装置
    7.
    发明授权

    公开(公告)号:CN111192599B

    公开(公告)日:2022-11-22

    申请号:CN201811352262.9

    申请日:2018-11-14

    Abstract: 本申请实施例公开了一种降噪方法及装置,其中方法包括:通过基于频域构建的深度学习训练模型对训练数据的时域特征值和目标值进行训练,服务器可以将得到的模型参数发送给终端设备,以使终端设备接收到该模型参数后,对第一语音降噪模型的参数进行更新,并使用更新后的第一语音降噪模型对用户输入的语音信息进行降噪处理。本申请实施例中,通过使用深度学习训练模型训练得到的模型参数对终端设备中的第一语音降噪模型的参数进行更新,可以使得终端设备采用深度学习训练模型训练得到的模型参数对用户输入的语音信息进行降噪处理,从而能够使降噪处理得到的语音信息更加准确,提高用户的体验感。

    一种视频去噪的方法和设备

    公开(公告)号:CN111212198A

    公开(公告)日:2020-05-29

    申请号:CN201811399755.8

    申请日:2018-11-22

    Abstract: 本发明公开了一种视频去噪的方法和设备,用以解决现有技术中在视频去噪后视频感知质量差的问题。本发明将接收到的待去噪视频分割成多个去噪视频的GOP,并根据去噪视频的GOP的第一质量值确定待去噪视频的第二质量值;根据待去噪视频的第二质量值确定稀疏表示阈值;将稀疏表示阈值和待去噪视频的像素值输入训练联合字典,以对待去噪视频进行稀疏表示去噪;其中,其中,训练联合字典为视频空域训练集和视频时域训练集采用KSVD方法训练的联合字典。由于本发明不仅对空域噪声进行了去噪处理,还对时域噪声进行了去噪处理,不仅保证了待去噪视频中每帧图像的质量,还保证视频不会产生抖动和闪烁等问题,提升视频的整体感知质量。

    一种降噪方法及装置
    10.
    发明公开

    公开(公告)号:CN111192599A

    公开(公告)日:2020-05-22

    申请号:CN201811352262.9

    申请日:2018-11-14

    Abstract: 本申请实施例公开了一种降噪方法及装置,其中方法包括:通过基于频域构建的深度学习训练模型对训练数据的时域特征值和目标值进行训练,服务器可以将得到的模型参数发送给终端设备,以使终端设备接收到该模型参数后,对第一语音降噪模型的参数进行更新,并使用更新后的第一语音降噪模型对用户输入的语音信息进行降噪处理。本申请实施例中,通过使用深度学习训练模型训练得到的模型参数对终端设备中的第一语音降噪模型的参数进行更新,可以使得终端设备采用深度学习训练模型训练得到的模型参数对用户输入的语音信息进行降噪处理,从而能够使降噪处理得到的语音信息更加准确,提高用户的体验感。

Patent Agency Ranking