-
公开(公告)号:CN112188212B
公开(公告)日:2024-02-13
申请号:CN202011082884.1
申请日:2020-10-12
Applicant: 杭州电子科技大学
IPC: H04N19/40 , H04N19/136 , H04N7/18 , G06V20/40 , G06V10/25 , G06V10/82 , G06N3/0464
Abstract: 本发明公开了一种高清监控视频智能转码的方法及装置,方法包括:S1,解码;S2,缩放;S3,目标检测,通过卷积神经网络学得的特征,将图像分割成单元格,单元格用于预测边界框,从而检测中心落在单元格中的目标对象;S4,跟踪,对比前后两帧中预测的边界框,实现对目标对象的跟踪;S5,丢帧,采用自适应丢帧操作,根据目标对象的位移矢量大小,判断关键帧的间隔长短,丢弃关键帧之间的非关键帧;S6,编码;装置包括:用于解码的GV9531芯片和用于编码VC8000E芯片,还包括分别与GV9531芯片和VC8000E芯片连接的CSKY860芯片,CSKY860芯片决定需要编码的图像帧。
-
公开(公告)号:CN116996682A
公开(公告)日:2023-11-03
申请号:CN202310993633.6
申请日:2023-08-08
Applicant: 杭州电子科技大学
IPC: H04N19/147 , H04N19/124 , H04N19/42 , H04N19/423 , H04N19/176
Abstract: 本发明公开了一种基于并行维特比算法的依赖性量化加速实现方法,该步骤首先将视频流划分为不同的图像帧,再得到变换单元TU。其次顺序读取TU中的系数以及编码属性信息,并获取量化候选值及其量化失真代价,同时记录高频筛选阈值通过情况存储到量化缓冲区中。然后划分各个并行处理单元的工作范围,各个并行处理单元读取量化缓冲区中的数据,计算率失真量化代价及最优量化候选值的索引存储到率失真缓冲区中。最后最优量化候选值的索引,选择量化缓冲区中的量化候选值输出,组成量化结果。本发明提高了数据处理的并行度,减少量化使用的时间消耗,并在灵活性、处理效率、资源消耗等方面具有更高的性能。
-
公开(公告)号:CN110929679B
公开(公告)日:2023-06-16
申请号:CN201911234544.3
申请日:2019-12-05
Applicant: 杭州电子科技大学
IPC: G06V40/10 , G06V20/52 , G06V10/762 , G06V10/764 , G06V10/774 , G06V10/82
Abstract: 本发明公开了一种基于GAN的无监督自适应行人重识别方法,包括如下步骤:步骤一,源域训练,在带有标签的源数据集上预训练CNN模型,通过采用批量归一化、一个全连接层、Adam优化器代替SGD,共同作用来训练CNN模型,解决了在源数据集上预训练CNN模型基线性能不足的问题;步骤二,自训练,采用所述预训练的CNN模型提取无标签目标数据集的特征,通过聚类获得伪标签,通过GAN来调整所述聚类,通过所述聚类获得的伪标签训练所述CNN模型。
-
公开(公告)号:CN110049338B
公开(公告)日:2023-04-18
申请号:CN201910344082.4
申请日:2019-04-26
Applicant: 杭州电子科技大学
IPC: H04N19/503 , H04N19/119 , H04N19/96 , H04N19/147 , H04N19/14 , H04N19/30 , H04N19/103
Abstract: 本发明公开了基于多层次分类的HEVC快速帧间编码方法。本发明包括运用CU层次的分类树、PU层次的分类树和TU层次的分类树实现HEVC快速帧间编码,其内容包括基于CU深度分类树的快速CU划分方法、基于帧间模式分类树的快速PU选择方法和基于TU深度分类树的TU划分方法。本发明利用了HEVC编码过程中CU深度、PU模式和TU深度在时空上的相似性,减少了CU划分的复杂度,简化了帧间预测模式的选择过程,同时利用TU的变换系数特征,降低了TU划分的复杂度。
-
公开(公告)号:CN115442620A
公开(公告)日:2022-12-06
申请号:CN202211095417.1
申请日:2022-09-06
Applicant: 杭州电子科技大学
IPC: H04N19/52 , H04N19/149 , H04N19/159 , H04N19/29 , H04N19/48
Abstract: 本发明属于视频编码领域,公开了一种AME低复杂度仿射运动估计方法,包括如下步骤:步骤1:基于划分深度的最优帧间模式的提前预测:根据父CU最优帧间模式来预测子CU最优帧间模式;步骤2:AME内部的低复杂度算法:在AME算法内部,通过CPMV平行与否、迭代过程的提前终止以及有无必要进行细粒度调整优化来加速AME算法;步骤3:AME外部的低复杂度算法:对于需要在传统Inter和AME之间进行模式决策的CU提取相关特征,基于决策树对这样的CU进行提前预测其最优帧间模式,以此跳过RDO决策及次优模式的遍历过程。本发明大大减少了VVC帧间模式决策复杂度。
-
公开(公告)号:CN115361557A
公开(公告)日:2022-11-18
申请号:CN202210992815.7
申请日:2022-08-18
Applicant: 杭州电子科技大学
IPC: H04N19/154 , H04N19/149 , H04N19/176 , H04N19/182 , H04N13/128 , H04N13/161
Abstract: 本发明方法公开了结合注意力机制的立体图像舒适度预测方法。本发明方法首先通过对输入的左、右视点图像分别进行半重叠采样,得到多个图像块对作为模型输入,分别得到低、中、高级特征的相加特征图和相减特征图;然后分别将低、中、高级特征的相加和相减特征图拼接成新的特征块,输入并行双注意力模块进行注意力加权;将低、中、高级特征的通道和空间注意力加权特征拼接成新的特征块,并分别输入对应的次要子网络,最终得到三个次要子网络的输出特征向量,合并三个次要子网络的输出特征向量,并输入用于回归预测的全连接层网络进行舒适度回归预测。本发明方法不仅降低了流程复杂度,还规避了因视差计算不准确带来的影响。
-
公开(公告)号:CN110428447B
公开(公告)日:2022-04-08
申请号:CN201910638477.5
申请日:2019-07-15
Applicant: 杭州电子科技大学
Abstract: 本发明公开一种基于策略梯度的目标跟踪方法与系统,属于计算机视觉领域。方法包括:(1)将目标图像输入到卷积神经网络中,得到目标外观模板Z;(2)将搜索图像输入到卷积神经网络中,等到搜索区域特征图;(3)将模板图像Z和搜索区域特征图通过相似度度量函数f计算得到响应图ht;(4)将(3)中得到的响应图ht和历史响应图hi输入到策略网络中,选择分数最高的那个动作加入到集合Ct(i=1~N);(5)重复(4)直到遍历响应图模板池中的每一个历史响应图;最后执行集合Ct(i=1~N)中出现次数最多的那个动作。所述系统包括跟踪器和决策器。避免了错误的模板更新,并在目标丢失的时候能够及时发现并重新找到目标。
-
公开(公告)号:CN113365062A
公开(公告)日:2021-09-07
申请号:CN202110577832.X
申请日:2021-05-26
Applicant: 杭州电子科技大学
IPC: H04N19/124 , H04N19/70 , H04N19/60 , H04N19/176 , H04N19/12 , G06N3/04 , G06N3/08
Abstract: 本发明属于视频编码领域,公开了一种基于H.266/VVC的分步全零块判决快速算法,包括如下步骤:首先,通过公式推导,得到一个真全零块(G‑AZB)预判决公式,所谓G‑AZB,即经过硬决策量化(HDQ)后为全零的变换块(TU);然后,对于那些经过HDQ后的非全零块,即伪全零块(P‑AZB),利用基于统计和经验得出的自适应阈值公式实现预判决;最后,对于剩余的一些“狡猾”的P‑AZB,利用机器学习,找寻了8个影响TU变成全零或者非全零块的影响因子,通过离线训练,实现预判决。本发明在保证性能基本不变的前提下,减少了计算复杂度;本发明在新一代视频编码标准VVC上进行,创新度较高。
-
公开(公告)号:CN112188212A
公开(公告)日:2021-01-05
申请号:CN202011082884.1
申请日:2020-10-12
Applicant: 杭州电子科技大学
IPC: H04N19/40 , H04N19/136 , H04N7/18 , G06K9/00 , G06N3/04
Abstract: 本发明公开了一种高清监控视频智能转码的方法及装置,方法包括:S1,解码;S2,缩放;S3,目标检测,通过卷积神经网络学得的特征,将图像分割成单元格,单元格用于预测边界框,从而检测中心落在单元格中的目标对象;S4,跟踪,对比前后两帧中预测的边界框,实现对目标对象的跟踪;S5,丢帧,采用自适应丢帧操作,根据目标对象的位移矢量大小,判断关键帧的间隔长短,丢弃关键帧之间的非关键帧;S6,编码;装置包括:用于解码的GV9531芯片和用于编码VC8000E芯片,还包括分别与GV9531芯片和VC8000E芯片连接的CSKY860芯片,CSKY860芯片决定需要编码的图像帧。
-
公开(公告)号:CN108965879B
公开(公告)日:2020-08-25
申请号:CN201811016478.8
申请日:2018-08-31
Applicant: 杭州电子科技大学
IPC: H04N19/13 , H04N19/147 , H04N19/567
Abstract: 本发明公开了一种空时域自适应恰可察觉失真的度量方法,其特征在于包括如下步骤:步骤一、将模式掩蔽效应PM和亮度适应性LA进行融合,得到空域JND阈值JNDS;步骤二、将相对运动I(vr)、背景运动U(vg)、时域持续时间I(τ)和残差波动强度U(δ)四个时域感知参量进行融合得到时域JND调节权重系数z;步骤三、在空域JND阈值JNDS基础上,用时域JND调节权重系数z对其进行调整,得到空时域JND阈值JNDST。
-
-
-
-
-
-
-
-
-