-
公开(公告)号:CN111212198B
公开(公告)日:2022-04-08
申请号:CN201811399755.8
申请日:2018-11-22
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
IPC: H04N5/21
Abstract: 本发明公开了一种视频去噪的方法和设备,用以解决现有技术中在视频去噪后视频感知质量差的问题。本发明将接收到的待去噪视频分割成多个去噪视频的GOP,并根据去噪视频的GOP的第一质量值确定待去噪视频的第二质量值;根据待去噪视频的第二质量值确定稀疏表示阈值;将稀疏表示阈值和待去噪视频的像素值输入训练联合字典,以对待去噪视频进行稀疏表示去噪;其中,其中,训练联合字典为视频空域训练集和视频时域训练集采用KSVD方法训练的联合字典。由于本发明不仅对空域噪声进行了去噪处理,还对时域噪声进行了去噪处理,不仅保证了待去噪视频中每帧图像的质量,还保证视频不会产生抖动和闪烁等问题,提升视频的整体感知质量。
-
公开(公告)号:CN111182256A
公开(公告)日:2020-05-19
申请号:CN201811329526.9
申请日:2018-11-09
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
Abstract: 本发明公开了一种信息处理方法及服务器,该方法包括:服务器获取N个终端设备采集的包括与会者人脸数据的视频数据;其中,N为大于等于2的整数;服务器从视频数据中提取与会者的人脸数据;服务器根据人脸数据从所有与会者中确定当前发言者;服务器将当前发言者的信息发送给N个终端设备,以使N个终端设备突出显示当前发言者的信息。在这种方式中,有助于提高服务器判断视频会议中的当前发言者的准确性。
-
公开(公告)号:CN110855908B
公开(公告)日:2022-09-27
申请号:CN201911128504.0
申请日:2019-11-18
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
IPC: H04N5/265 , H04N7/15 , H04N19/132 , H04N19/14 , H04N19/149 , H04N19/176
Abstract: 本发明实施方式涉及通信技术领域,公开了一种多方视频混屏方法,该方法包括:获取待混屏的N个视频的编码帧和每个视频的输入帧率,N为大于1的自然数;将输入帧率与预设帧率不同的视频的编码帧进行解码得到解码帧,并获取输入帧率与预设帧率不同的视频的特征参数;将特征参数输入至运动复杂度模型,得到输入帧率与预设帧率不同的视频的运动复杂度;根据预设帧率和运动复杂度对解码帧进行插帧或抛帧处理,得到处理后的解码帧;根据处理后的解码帧合成混屏视频。本发明实施方式还提供了一种多方视频混屏装置、网络设备及存储介质。本发明实施方式提供的多方视频混屏方法、装置、网络设备及存储介质,可以提高混屏的通信视频的显示效果。
-
公开(公告)号:CN111355919A
公开(公告)日:2020-06-30
申请号:CN201811580965.7
申请日:2018-12-24
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
Abstract: 本发明涉及通信技术领域,尤其涉及一种通信会话控制方法及装置,获取通信会话中任意一个参与者的音频数据;判断所述任意一个参与者是否为静音状态,若确定为静音状态,则进一步判断是否为所述通信会话中预设管理方将所述任意一个参与者设置为静音状态;若确定不是,则将所述任意一个参与者的音频数据发送给除将其设置为静音状态的参与者之外的其他参与者,这样,不仅可以将静音权限赋予给通信会话中更多的参与者,能够对嘈杂参与者快速静音,提高通信会话的质量,并且还将静音权限进行细分,若不是管理方将某参与者静音,则只有将其设置为静音状态的参与者不能接收其音频数据,可以减少通信会话中的不可控行为,提高通信会话可靠性和质量。
-
公开(公告)号:CN111355919B
公开(公告)日:2021-05-25
申请号:CN201811580965.7
申请日:2018-12-24
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
Abstract: 本发明涉及通信技术领域,尤其涉及一种通信会话控制方法及装置,获取通信会话中任意一个参与者的音频数据;判断所述任意一个参与者是否为静音状态,若确定为静音状态,则进一步判断是否为所述通信会话中预设管理方将所述任意一个参与者设置为静音状态;若确定不是,则将所述任意一个参与者的音频数据发送给除将其设置为静音状态的参与者之外的其他参与者,这样,不仅可以将静音权限赋予给通信会话中更多的参与者,能够对嘈杂参与者快速静音,提高通信会话的质量,并且还将静音权限进行细分,若不是管理方将某参与者静音,则只有将其设置为静音状态的参与者不能接收其音频数据,可以减少通信会话中的不可控行为,提高通信会话可靠性和质量。
-
公开(公告)号:CN111223492A
公开(公告)日:2020-06-02
申请号:CN201811405778.5
申请日:2018-11-23
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
IPC: G10L21/0208 , G10L21/0216
Abstract: 本发明公开了一种回声路径延迟估计方法及装置,回声路径延迟估计装置通过执行回声路径延迟估计方法,包括:对输入信号进行预处理获取预处理后的语音信号;对预处理后的语音信号进行时频转换获取频域信号;获取所述频域信号的特征参数,其中,所述特征参数包括噪声阈值、所述近端语音信号的傅里叶变换值、所述远端语音信号的傅里叶变换值、长时能量值和短时能量值;将所述特征参数输入所述深度学习回声路径延迟估计模型,获取回声路径的延迟估计值。从而解决现有技术中存在的现有的回声消除算法中的回声路径延迟估计方法具有局限性,无法适用于不同的回声环境的技术问题。
-
公开(公告)号:CN111192599B
公开(公告)日:2022-11-22
申请号:CN201811352262.9
申请日:2018-11-14
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
IPC: G10L21/0224 , G10L21/0232 , H04M3/18 , H04M1/19
Abstract: 本申请实施例公开了一种降噪方法及装置,其中方法包括:通过基于频域构建的深度学习训练模型对训练数据的时域特征值和目标值进行训练,服务器可以将得到的模型参数发送给终端设备,以使终端设备接收到该模型参数后,对第一语音降噪模型的参数进行更新,并使用更新后的第一语音降噪模型对用户输入的语音信息进行降噪处理。本申请实施例中,通过使用深度学习训练模型训练得到的模型参数对终端设备中的第一语音降噪模型的参数进行更新,可以使得终端设备采用深度学习训练模型训练得到的模型参数对用户输入的语音信息进行降噪处理,从而能够使降噪处理得到的语音信息更加准确,提高用户的体验感。
-
公开(公告)号:CN111327946A
公开(公告)日:2020-06-23
申请号:CN201811541314.7
申请日:2018-12-17
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
Abstract: 本申请实施例提供了一种视频质量评价和特征字典的训练方法、装置和介质,涉及视频信号处理和多媒体通信领域,用以在无原始视频的条件下,对视频质量进行预测。该方法中,获取待评价视频的特征信息;根据预先存储的特征字典,对所述待评价视频的特征信息进行稀疏表示,得到稀疏系数;获取所述特征字典中表示评价值的向量,与所述稀疏系数构成的向量进行相乘,得到所述待评价视频的评价值。这样,可以在没有待评价视频的原始视频的条件下准确的对待评价视频进行预测,提高视频评价的效率,节省人力。
-
公开(公告)号:CN111212198A
公开(公告)日:2020-05-29
申请号:CN201811399755.8
申请日:2018-11-22
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
IPC: H04N5/21
Abstract: 本发明公开了一种视频去噪的方法和设备,用以解决现有技术中在视频去噪后视频感知质量差的问题。本发明将接收到的待去噪视频分割成多个去噪视频的GOP,并根据去噪视频的GOP的第一质量值确定待去噪视频的第二质量值;根据待去噪视频的第二质量值确定稀疏表示阈值;将稀疏表示阈值和待去噪视频的像素值输入训练联合字典,以对待去噪视频进行稀疏表示去噪;其中,其中,训练联合字典为视频空域训练集和视频时域训练集采用KSVD方法训练的联合字典。由于本发明不仅对空域噪声进行了去噪处理,还对时域噪声进行了去噪处理,不仅保证了待去噪视频中每帧图像的质量,还保证视频不会产生抖动和闪烁等问题,提升视频的整体感知质量。
-
公开(公告)号:CN111192599A
公开(公告)日:2020-05-22
申请号:CN201811352262.9
申请日:2018-11-14
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
IPC: G10L21/0224 , G10L21/0232 , H04M3/18 , H04M1/19
Abstract: 本申请实施例公开了一种降噪方法及装置,其中方法包括:通过基于频域构建的深度学习训练模型对训练数据的时域特征值和目标值进行训练,服务器可以将得到的模型参数发送给终端设备,以使终端设备接收到该模型参数后,对第一语音降噪模型的参数进行更新,并使用更新后的第一语音降噪模型对用户输入的语音信息进行降噪处理。本申请实施例中,通过使用深度学习训练模型训练得到的模型参数对终端设备中的第一语音降噪模型的参数进行更新,可以使得终端设备采用深度学习训练模型训练得到的模型参数对用户输入的语音信息进行降噪处理,从而能够使降噪处理得到的语音信息更加准确,提高用户的体验感。
-
-
-
-
-
-
-
-
-