-
公开(公告)号:CN102186087B
公开(公告)日:2013-06-12
申请号:CN201110172229.X
申请日:2011-06-24
Applicant: 哈尔滨工业大学
Abstract: 用于二进制算术编码可并行的非零系数上下文建模方法,它涉及视频编码的上下文建模技术。它为解决现有二进制算术编码在对非零系数进行上下文建模过程中存在对上下文产生数据的依赖关系,使编码系统的数据吞吐率降低的问题而提出。一:定义变换量化块中系数、非零系数的个数;二:对非零系数二值化得到bin序列,三:以非零系数的位置信息和该变换量化块中非零系数的个数为第一上下文进行上下文建模;四:计算绝对值为abs(Li)的非零系数在第一上下文下取值的概率分布;五:对Li的绝对值减1进行二值化,六:利用等概率分布进行上下文建模。它可使不同的非零系数的上下文建模过程同时进行,实现了编码过程中多个上下文建模并行执行。
-
公开(公告)号:CN1142518C
公开(公告)日:2004-03-17
申请号:CN02132598.7
申请日:2002-07-12
CPC classification number: G06T1/005 , G06T2201/0052
Abstract: 数字水印嵌入媒体信息和从媒体信息中析出可复原水印信息的方法,它属于模式识别领域。首先是对媒体信息进行二层小波变换,在H2L2和L2H2系数区域分别嵌入水印信息和跟踪阵信息,逆小波变换恢复原媒体信息。当媒体信息被处理、攻击后,先对媒体信息进行小波变换,提取跟踪阵,计算跟踪阵和原始跟踪阵内容的相似度,恢复媒体信息,根据跟踪阵相似度确定媒体信息经历的各种攻击、处理的方法和程度,提供了一个还原媒体信息的依据和参照,最后再还原得出媒体信息中有效的水印信息。本发明中的媒体信息如受到干扰和处理后,提取的水印也较清晰,这对于媒体等信息的被盗版、被非法拷贝具有很好的判断作用。
-
公开(公告)号:CN118038227A
公开(公告)日:2024-05-14
申请号:CN202410278475.0
申请日:2024-03-12
Applicant: 哈尔滨工业大学
IPC: G06V10/80 , G06V20/40 , G06N3/0464 , G06N3/0455 , G06V10/82 , G06V10/40
Abstract: 基于语义信息的无参考视频质量评价方法以及装置,属于视觉语言大模型,尤其涉及无参考视频质量的评价技术领域;解决了现有基于深度学习的无参考视频质量评价方法所存在的提取的特征解释性低、对视频质量的评价与人类视觉感知一致性差的问题;所述方法包括以下步骤:S1、语义特征提取步骤:S2、空间特征提取步骤:S3、特征聚合步骤:S3.1、将所述待评价视频的2×r维的语义特征向量和空间特征向量连接起来,获得所述待评价视频的质量特征;S3.2、将所述待评价视频的质量特征作为回归头的输入,获得所述待评价视频的质量评价分数。所述的基于语义信息的无参考视频质量评价方法以及装置,适用于无参考视频质量的评价。
-
公开(公告)号:CN117036885A
公开(公告)日:2023-11-10
申请号:CN202311018030.0
申请日:2023-08-14
Abstract: 一种融合视频画面和场景文本信息的跨模态视频正能量评价方法、系统及计算机存储介质,涉及视频敏感内容分析领域。解决现有基于回归的方法仅考虑了视频中的视觉特征,而忽略了视频中的场景文字信息的问题。本发明提供以下方案,获取视频片段,使用预先训练好的R3D模型对视频片段进行特征选取,得到多个特征向量;对获得的多个特征向量进行全局平均池化操作,并通过全连接获得视频画面特征;提取视频画面特征中的场景文本特征,即删除重复的场景文本特征或句子;文本编辑器用于提取场景文本特征,同时对BERT组件输出的标记嵌入进行均值池化操作,以获得每个句子的特征向量;将获得的视频画面特征和获得的场景文本特征同时输入特征融合模块中,分别使用视觉编码器和场景文本编码器并聚合跨模态融合令牌对两种模态信息进行联合编码;将特征融合模块的输出作为MLP模块的输入,通过MLP模快的处理获得视频的正能量分数。还适用于视频画面信息与场景文本信息提取领域。
-
公开(公告)号:CN113362213A
公开(公告)日:2021-09-07
申请号:CN202110505887.X
申请日:2021-05-10
Applicant: 哈尔滨工业大学
IPC: G06T1/00
Abstract: 本发明公开了一种基于直方图的加密域水印方法,包括:步骤S1,采用图像置乱法对明文图像进行加密,获得加密图像;具体地,可采用基于混沌序列的图像置乱法,生成混沌序列;再按照不同的通道进行图像分块,将混沌序列进行排序后,按照混沌序列调整对应的图像块顺序,得到加密图像;步骤S2,更改加密图像的像素值嵌入数字水印,得到嵌入水印后的加密图像;具体地,通过均值法确定直方图需要嵌入数字水印的像素值;根据预设水印嵌入规则遍历加密图像对其像素值进行修改,且整体像素值总和不变,直至所有水印比特全嵌入,得到嵌入水印后的加密图像。该方法嵌入到图像的数字水印信息不会因加解密的过程发生变化,进而保证数字水印在解密后的图像中发挥作用。
-
公开(公告)号:CN118135040A
公开(公告)日:2024-06-04
申请号:CN202410192649.1
申请日:2024-02-21
Applicant: 哈尔滨工业大学
IPC: G06T9/00 , G06T5/20 , G06N3/084 , G06N3/0464 , G06N3/045
Abstract: 本发明是一种基于中值滤波自适应采样和自注意力重构的图像压缩感知方法。本发明涉及图像重建技术领域,本发明进行基础采样和自适应采样;根据采样结果,基于重建网络进行初始化重建。本发明提出了一种基于中值滤波的自适应采样模块。采样过程包括两个阶段:第一阶段进行初始基本采样以获取参考图像,第二阶段基于参考图像的稀疏性进行自适应采样。本发明还提出了基于Swin Transformer的U‑Net结构,在不增加太大复杂度的情况下,增加了图像的不同区域之间的全局和局部交互作用。
-
公开(公告)号:CN118115917A
公开(公告)日:2024-05-31
申请号:CN202410278473.1
申请日:2024-03-12
Applicant: 哈尔滨工业大学
IPC: G06V20/40 , G06V10/82 , G06N3/0455 , G06N3/0442 , G06N3/0895
Abstract: 无参考视频质量评价方法、程序产品及存储介质,属于视觉语言大模型,尤其涉及无参考视频质量的评价技术领域;解决了现有基于深度学习的无参考视频质量评价方法所存在的提取的特征解释性低、与人类视觉系统的感知一致性差的问题;所述方法包括以下步骤:S1、特征提取:S1.2、将所述N条文本描述和待评价视频作为所述CLIP模型的输入,获得所述待评价视频的每一个视频帧的N维特征向量;S2、特征降维;S3、特征聚合;S3.4、将所述表征每一个视频帧的质量评价分数与所述待评价视频的整体质量评价分数之间关系的参数输入MLP模块,获得所述待评价视频的整体质量评价分数。所述的无参考视频质量评价方法,适用于无参考视频质量的评价。
-
公开(公告)号:CN113160050B
公开(公告)日:2023-08-25
申请号:CN202110319609.5
申请日:2021-03-25
Applicant: 哈尔滨工业大学
IPC: G06T3/40 , G06T5/00 , G06V10/25 , G06V10/80 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/048 , G06N3/049 , G06N3/08
Abstract: 本发明公开了一种基于时空神经网络的小目标识别方法及系统,其中,该方法包括:运用超分辨率算法对原始模糊图像进行预处理,得到高画质图像序列;利用时空注意力机制对高画质图像序列的相邻帧间进行逻辑减操作,捕捉并高亮强调可疑区域;提取可疑区域中的深度特征,得到特征图时序序列;采用LSTM状态转移子网将特征图时序序列输入到置信输出的映射装置中,得到转移状态;利用分类器对转移状态进行分类,得到最终识别结果,其中,最终识别结果为目标种类和置信率。该方法随着帧序列的不断读入,模型进行自我修正,逐渐修正为正确的类别并不断提高置信率。
-
公开(公告)号:CN115713708A
公开(公告)日:2023-02-24
申请号:CN202211334574.3
申请日:2022-10-28
Applicant: 哈尔滨工业大学
IPC: G06V20/40 , G06V10/44 , G06V10/80 , G06V10/764 , G06V10/82 , G06N3/08 , G06T7/00 , G06N3/0464
Abstract: 本发明公开了一种基于Transformer的模仿人眼特性的视频质量评价方法及装置,涉及无参考视频客观质量评价技术领域,解决的技术问题为“如何进行时序融合并考虑到人眼特性,以实现更好的评价效果”,方法包括:获取待评价视频片段,并提取待评价视频片段的帧图像;对帧图像进行内容特征提取,得到各个帧图像对应的第一特征向量;基于视频片段时序信息,对第一特征向量进行位置编码;基于Transformer模型,对经过位置编码的第一特征向量进行特征聚合,得到各个帧图像对应的初步质量分数;将多个帧图像的初步质量分数输入时间池模型,计算得到视频片段最终质量分数;该方法基于Transformer模型进行时序融合,并且能够考虑到人眼特性对视频质量评价的影响,预测准确率更高。
-
公开(公告)号:CN115511756A
公开(公告)日:2022-12-23
申请号:CN202110697703.4
申请日:2021-06-23
Applicant: 中兴通讯股份有限公司 , 哈尔滨工业大学
Abstract: 本申请实施例提供了一种视频增强处理方法、装置、电子设备和存储介质,其中,该方法包括:确定待增强图像的增强辅助图像,其中,所述增强辅助图像和所述待增强图像为压缩视频数据解码生成的重建图像;基于所述待增强图像、所述增强辅助图像和预设特征提取网络确定时空特征图;根据预设特征增强网络处理所述时空特征图以生成叠加图像;根据所述叠加图像处理所述待增强图像以生成视频增强图像。本申请实施例通过包括时空特征的图像对待增强图像进行处理以生成视频增强图像,基于视频重建图像的时空特征提高图像的显示质量,提高视频的显示效果,可增强用户的观看体验。
-
-
-
-
-
-
-
-
-