-
公开(公告)号:CN111669532B
公开(公告)日:2021-08-10
申请号:CN202010488758.X
申请日:2020-06-02
Applicant: 国家广播电视总局广播电视科学研究院
Abstract: 本发明涉及一种高动态范围视频端到端实现方法,其主要技术特点是:制作视频节目,得到HLG视频;对HLG视频进行编码,得到编码码流;编码码流经过不同的传输网络进行传输;接收端对接收到的传输码流进行解码处理,根据显示终端的显示能力,将HLG视频送至显示终端进行显示。本发明设计合理,其在现有基于HLG的超高清电视系统中,增加PQ动态元数据的提取和传输,如果是现有支持HLG视频的终端,直接显示;如果是支持PQ视频的终端,将HLG转换为PQ视频动态适配后显示,可以在不改变现有传输方式的基础上,实现不同显示终端的最佳还原显示功能。
-
公开(公告)号:CN110781932A
公开(公告)日:2020-02-11
申请号:CN201910971340.1
申请日:2019-10-14
Applicant: 国家广播电视总局广播电视科学研究院 , 北京博雅睿视科技有限公司
Abstract: 本发明涉及一种多类别图像转换与对比的超高清片源色域检测方法,其技术特点是:构造多类别图像转换与对比的色域检测网络,用于对BT.709和BT.2020两种视频片源的色域进行检测;构建图像转换与对比层,对输入图像进行转换,增加不同类别特征间的参照和对比;使用残差网络作为初始网络,将原始输入图像和转换后的图像同时输入初始网络;对色域检测网络进行训练,得到BT.709和BT.2020两类别的色域分类模型,并由该色域分类模型图像的色域类别。本发明设计合理,对超高清视频片源的色域进行技术符合性检测,将色域检测问题归结为图像分类问题,并结合图像分类任务中的卷积神经网络,获得了很好的色域检测结果,使得系统整体检测准确率大大提升。
-
公开(公告)号:CN110781932B
公开(公告)日:2022-03-11
申请号:CN201910971340.1
申请日:2019-10-14
Applicant: 国家广播电视总局广播电视科学研究院 , 北京博雅睿视科技有限公司
IPC: G06V10/764 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明涉及一种多类别图像转换与对比的超高清片源色域检测方法,其技术特点是:构造多类别图像转换与对比的色域检测网络,用于对BT.709和BT.2020两种视频片源的色域进行检测;构建图像转换与对比层,对输入图像进行转换,增加不同类别特征间的参照和对比;使用残差网络作为初始网络,将原始输入图像和转换后的图像同时输入初始网络;对色域检测网络进行训练,得到BT.709和BT.2020两类别的色域分类模型,并由该色域分类模型图像的色域类别。本发明设计合理,对超高清视频片源的色域进行技术符合性检测,将色域检测问题归结为图像分类问题,并结合图像分类任务中的卷积神经网络,获得了很好的色域检测结果,使得系统整体检测准确率大大提升。
-
公开(公告)号:CN109614853B
公开(公告)日:2023-05-05
申请号:CN201811273872.X
申请日:2018-10-30
Applicant: 国家新闻出版广电总局广播科学研究院 , 北京邮电大学
IPC: G06N3/045 , G06N3/0464 , G06N3/082 , G06V10/82 , G06V40/10
Abstract: 本发明涉及一种基于身体结构划分的双线性行人再识别网络构建方法,包括以下步骤:对原始行人图像进行身体结构分块得到多个结构子框,将多个子框组合成新的行人图像,构造结构框预测子网络;设置加权的局部损失函数来训练该结构框预测子网络;构造两个子网络,分别以原始行人图像和重组后行人图像作为输入,对应地提取全局行人特征和局部行人特征;设置双线性融合层,并将其作为全局特征和局部特征的融合层,得到最终的行人特征表示;对整体网络进行训练,得到基于身体结构划分的双线性行人再识别模型。本发明结合整体特征和局部特征,充分利用了身体结构信息,通过双线性融合方法获得更具判别力的行人特征,使得系统整体匹配准确率大大提升。
-
公开(公告)号:CN107563381B
公开(公告)日:2020-10-23
申请号:CN201710816619.3
申请日:2017-09-12
Applicant: 国家新闻出版广电总局广播科学研究院 , 北京邮电大学
Abstract: 本发明设计了一种基于全卷积网络的多特征融合的目标检测方法,其主要技术特点是:搭建具有六个卷积层组的全卷积神经网络;利用卷积神经网络的前五组卷积层提取图像特征,并将其输出进行融合,形成融合特征图;对融合后的特征图进行卷积处理,直接产生固定数目的不同大小的目标边框;计算卷积神经网络生成的目标边框与真实边框之间的分类误差与定位误差,利用随机梯度下降法降低训练误差,得到最终训练模型的参数,最后进行测试得到目标检测结果。本发明利用了深度卷积网络对目标的强大的表示能力,构建了用于目标检测的全卷积神经网络,提出了新的融合特征方法,提高了算法的检测速度和精度,获得了良好的目标检测结果。
-
公开(公告)号:CN107729993A
公开(公告)日:2018-02-23
申请号:CN201711033085.3
申请日:2017-10-30
Applicant: 国家新闻出版广电总局广播科学研究院 , 北京邮电大学
IPC: G06N3/04
CPC classification number: G06N3/0454
Abstract: 本发明涉及一种利用训练样本及折中度量的3D卷积神经网络构建方法,其技术特点是:构造孪生结构的3D卷积神经网络;设置网络的损失函数,该损失函数由正样本损失、负样本损失及正则化损失构成,并在正则化损失中结合了马氏距离和欧氏距离;使用softmax损失函数,使用视频序列形式的数据集对网络进行预训练;构造正样本对和负样本对,对图像进行预处理和分割;有选择地利用训练样本对网络进行训练。本发明设计合理,其有选择地使用训练样本来提高训练效率并抑制过拟合,同时,在对特征进行度量时对欧氏距离和马氏距离进行权衡,从而构建3D卷积神经网络模型,试验表明本发明构建的模型及训练策略使得系统整体匹配率大大提升。
-
公开(公告)号:CN109190752B
公开(公告)日:2021-07-23
申请号:CN201810841610.2
申请日:2018-07-27
Applicant: 国家新闻出版广电总局广播科学研究院 , 北京邮电大学
Abstract: 本发明涉及一种基于深度学习的全局特征和局部特征的图像语义分割方法,包括以下步骤:在编码端,使用基于深度学习卷积神经网络模型提取图像的基础深度特征,同时根据卷积层的深度将特征分为低层特征和高层特征;应用特征融合模块将低层特征和高层特征融合成增强型的深度特征;在获取深度特征后,将其输入到解码端;以交叉熵损失函数为目标训练网络,使用mIoU评价网络性能。本发明设计合理,其使用深度卷积神经网络模型提取图像的全局和局部特征,充分利用了全局特征和局部特征的互补性,并且利用了堆叠池化层进一步提高性能,有效地提高了图像语义分割地准确率。
-
公开(公告)号:CN108960140A
公开(公告)日:2018-12-07
申请号:CN201810721690.8
申请日:2018-07-04
Applicant: 国家新闻出版广电总局广播科学研究院 , 北京邮电大学
CPC classification number: G06K9/00362 , G06K9/6256 , G06K9/6267 , G06N3/0454
Abstract: 本发明涉及一种基于多区域特征提取和融合的行人再识别方法,利用残差网络提取全局特征,并在训练阶段增加一个用于全局特征提取和优化的行人身份分类模块;构造用于局部特征提取的多区域特征提取子网络,并将各局部特征进行加权融合;设置包括分类模块损失和特征融合模块损失的损失函数;对网络进行训练,得到模型提取查询集和测试集的特征向量;在度量阶段,利用交叉近邻方法对特征距离进行重新度量。本发明设计合理,有效结合了全局特征和局部特征,在距离度量方法上进行优化,获得了很好的行人再识别结果,使得系统整体匹配准确率大大提升。
-
公开(公告)号:CN107316058A
公开(公告)日:2017-11-03
申请号:CN201710450327.2
申请日:2017-06-15
Applicant: 国家新闻出版广电总局广播科学研究院 , 北京邮电大学
CPC classification number: G06K9/629 , G06K9/4604 , G06K9/6227 , G06K9/6256 , G06N3/04
Abstract: 本发明涉及一种通过提高目标分类和定位准确度改善目标检测性能的方法,其主要技术特点是:根据卷积神经网络架构提取图像特征,并选择卷积层前M层输出进行特征融合,形成多特征的特征图;在卷积层M上进行网格划分,在每个网络中预测固定数目和大小的目标候选框;将候选框映射到特征图上进行裁剪,然后将裁剪结果进行多特征连接;将上述结果通过全连接层后,通过Softmax分类算法对图像特征进行分类,并用重叠面积损失函数进行在线迭代回归定位,得到最终目标检测的结果。本发明设计合理,通过卷积神经网络提取特征,并对图像特征进行多层融合,最后使用Softmax分类算法对图像特征进行分类,并采用重叠面积损失函数进行定位,获得了良好的目标检测结果。
-
公开(公告)号:CN104219526B
公开(公告)日:2017-05-24
申请号:CN201410440120.3
申请日:2014-09-01
Applicant: 国家广播电影电视总局广播科学研究院 , 北京邮电大学
IPC: H04N19/154 , H04N17/00
Abstract: 本发明涉及一种基于恰可察感知质量判决准则的HEVC率失真优化算法,其技术特点是:分析每一帧中每个宏块的运动模式及静态纹理特征,获得当前宏块的感知质量类型,得到图像显著区域;计算基于视觉显著性区域的恰可察失真阈值;计算基于恰可察失真模型的感知质量;根据基于恰可察失真模型的感知质量进行率失真优化。本发明设计合理,其采用基于恰可察感知质量判决准则进行HEVC率失真优化,能够克服均方误差MSE作为衡量视频失真评价标准的不足,使得最终的编码效果更加符合人眼的主观感知质量,同时,在主观质量不降低的前提下容忍更多的噪声,去除不必要的感知冗余,从而提高了压缩效率,降低了编码后文件的码率。
-
-
-
-
-
-
-
-
-