直播字幕生成方法、系统、设备及存储介质

    公开(公告)号:CN114040255A

    公开(公告)日:2022-02-11

    申请号:CN202111259282.3

    申请日:2021-10-28

    Abstract: 本发明公开了直播字幕生成方法、系统、设备及存储介质,方法包括:S100:接收直播信源,解码分离出视频流和多条音轨的音频流;S200:接收多个音频流,识别并生成多个第一字幕数据;第一字幕数据中包含各个音频流中语音所对应的语音识别文本以及所对应的时间序列;实时翻译各语音识别文本,分别生成多个语音翻译文本;S300:接收多个语音识别文本和对应的语音翻译文本,封装成多语种的字幕流;S400:利用转码引擎基于时间序列,按帧格式对视频流、音频流以及字幕流进行编码封装,输出带有字幕切片的多条HLS直播流。本发明实现字幕与音视频同步,并且播放端可以根据需求选择音轨、字幕显示,满足不同视听需求的受众群体。

    基于WGAN-GP和U-net改进的图像增强的方法、装置及存储介质

    公开(公告)号:CN110493242B

    公开(公告)日:2022-02-11

    申请号:CN201910796909.5

    申请日:2019-08-27

    Abstract: 本发明公开了基于WGAN‑GP和U‑net改进的图像增强的方法、装置及存储介质,其方法包括如下步骤:解封装输入的视频流或文件,得到第一视频码流和第一音频码流;解码所述第一视频码流,得到第一YUV数据;构建WGAN‑GP网络;将所述第一YUV数据输入所述WGAN‑GP网络,经所述WGAN‑GP网络训练输出第二YUV数据;对所述第二YUV数据编码得到第二视频码流;将所述第二视频码流和第一音频码流封装为视频流或文件。本发明通过WGAN‑GP网络训练视频码流,可以提升视频的画质,降低重新采集视频的成本。

    在线转码的日志管理方法、系统、设备及存储介质

    公开(公告)号:CN113992537A

    公开(公告)日:2022-01-28

    申请号:CN202111247546.3

    申请日:2021-10-26

    Abstract: 本发明公开了在线转码的日志管理方法、系统、设备及存储介质,方法包括:S100,将日志自定义属性标签动态即时更新到音视频终端在线转码应用的日志配置文件中;S200:打印各项在线转码任务的日志源文件,并通过采集、过滤以分开存储日志源文件中的日志内容;S300:按照时间序列提取分开存储的日志内容,通过监控终端按照展示配置实时展示日志内容,并且对触发告警规则的日志内容进行提醒处理。本发明通过在程序外部修改日志配置文件,然后即时替换更新,从而实现不中断程序即可对日志内容自定义管理,并且利用自定义展示的日志内容监控程序的运行情况。

    多画面合成方法、装置、设备及存储介质

    公开(公告)号:CN112511768A

    公开(公告)日:2021-03-16

    申请号:CN202011357310.0

    申请日:2020-11-27

    Abstract: 本发明公开了一种多画面合成方法、装置、设备及存储介质,针对现有的多画面合成技术,当输入源增多时,计算复杂度增加,多画面合成效率变低,实时性变差,严重影响用户的观看体验的问题,通过从CDN云服务器订阅输入码流到本地,对输入流进行解封装、解码,并记录此时UTC时间戳,建立时间同步统一基准;视频合成时,采用多进一出模型,对输入源相同的UTC时间戳,一次性合成,提高视频合成效率,防止造成视频播放卡顿,提升用户的观看体验感。

    一种视频的2D到3D的转换方法

    公开(公告)号:CN112019828A

    公开(公告)日:2020-12-01

    申请号:CN202010819481.4

    申请日:2020-08-14

    Abstract: 本发明涉及视频维度转换的技术领域,提供了一种视频的2D到3D的转换方法,包括步骤:S1:收集开源的RGB-D图像数据集并进行扩充,形成深度估计数据集,通过深度估计数据集构建深度估计模型并对深度估计模型进行训练;S2:收集4K高清图片制作图像修复数据集,并进行扩充,通过图像修复数据集构建图像修复模型,并对图像修复模型进行训练;S3:使用预训练Mask-RCNN模型提取原图像掩码,调整原图和掩码分辨率并送入深度估计模型,根据深度图计算原左右投影图,将左右投影图分别送入图像修复模型以修复黑洞区域。结合深度学习算法和传统算法,使用深度学习模型替换传统DIBR方法中深度图估计算法和黑洞填充算法,实现了在超高分辨率图像上的2D/3D转换。

    视频图像色彩增强的方法、装置、设备及存储介质

    公开(公告)号:CN112019827A

    公开(公告)日:2020-12-01

    申请号:CN202010911211.6

    申请日:2020-09-02

    Abstract: 本发明公开了一种视频图像色彩增强的方法、装置、设备及存储介质,针对传统的色彩增强方法不能解决影视剧复杂多变场景下图像色彩增强的不确定性和鲁棒性的问题,通过FFmpeg对视频进行解码,得到视频图像,将视频图像输入色彩增强网络进行色彩增强操作后,得到色彩增强图像,再利用深度学习模型对色彩增强图像进行细节纹理特征、图像亮度及目标前景等作进一步丰富和改善,提高视频图像的视觉效果,适用于复杂多场景的视频图像处理。

    基于WGAN-GP和U-net改进的图像增强的方法、装置及存储介质

    公开(公告)号:CN110493242A

    公开(公告)日:2019-11-22

    申请号:CN201910796909.5

    申请日:2019-08-27

    Abstract: 本发明公开了基于WGAN-GP和U-net改进的图像增强的方法、装置及存储介质,其方法包括如下步骤:解封装输入的视频流或文件,得到第一视频码流和第一音频码流;解码所述第一视频码流,得到第一YUV数据;构建WGAN-GP网络;将所述第一YUV数据输入所述WGAN-GP网络,经所述WGAN-GP网络训练输出第二YUV数据;对所述第二YUV数据编码得到第二视频码流;将所述第二视频码流和第一音频码流封装为视频流或文件。本发明通过WGAN-GP网络训练视频码流,可以提升视频的画质,降低重新采集视频的成本。

    通过多个移动终端实现360度摄影或录像的系统及方法

    公开(公告)号:CN106603926A

    公开(公告)日:2017-04-26

    申请号:CN201710008748.X

    申请日:2017-01-05

    CPC classification number: H04N5/23203 H04N5/0733 H04N5/23206 H04N5/23238

    Abstract: 本发明公开了一种通过多个移动终端实现360度摄影或录像的系统及方法,该系统包括:一主控移动终端及多个被控移动终端,多个被控移动终端至少包括四个。该方法包括:主控移动终端及多个被控移动终端接入同一网络;主控移动终端同时向多个被控移动终端发送摄影指令或录像指令;多个被控移动终端接收主控移动终端发送的摄影指令或录像指令,同时进行摄影或录像,并将摄影文件或录像文件传送给主控移动终端;主控移动终端接收将多个被控移动终端的摄影文件或录像文件拼接,合成360度全景照片或录像。本发明的通过多个移动终端实现360度摄影或录像的系统及方法,能够通过多个移动终端来实现360全景摄影和全景录像,无需购买昂贵的设备。

    RSFEC解码算法的解码性能优化方法

    公开(公告)号:CN103780352B

    公开(公告)日:2017-02-01

    申请号:CN201410036610.7

    申请日:2014-01-26

    Abstract: 本发明公开了一种RSFEC解码算法的解码性能优化方法,包括步骤:S1、根据数据码的数量m、冗余码的数量n枚举出所有丢包的位置,并将每一丢包位置所对应的解码矩阵写入一解码矩阵文件,在系统启动时将解码矩阵文件载入缓存;S2、将每一数据码以及每一冗余码分别对应一m+n位数的二进制数中的一位,用二进制数中的1或0来表示是否丢包,以得到一长度为2m+n的指针数组,分别对应解码矩阵文件中的每一解码矩阵;S3、在丢包解码状态下,将所丢包的位置的数据码和冗余码,转换成二进制数,根据指针数组从解码矩阵文件中找到对应的解码矩阵进行解码。

    Linux服务器集群管理的管理和维护方法

    公开(公告)号:CN103716188B

    公开(公告)日:2016-09-14

    申请号:CN201310714103.X

    申请日:2013-12-20

    Abstract: 一种Linux服务器集群管理的管理和维护方法,包括:S1、在管理服务器上安装文件安装部署包以及安全外壳传输协议;S2、增量文件传输服务,包括配置管理服务器传递到Linux服务器集群的部署文件的备份目录;S3、创建部署目录,用以存放管理服务器传递到Linux服务器集群的部署文件;S4、配置server配置文件,包括设置Linux服务器集群的IP地址及其对应部署的应用服务,并指定Linux服务器集群对应的应用服务目录;S5、管理服务器通过Linux服务器集群的IP和密码连接Linux服务器集群;S6、管理服务器发送脚本化的兼容语言至Linux服务器集群,控制Linux服务器集群执行对应的操作。

Patent Agency Ranking