-
公开(公告)号:CN117478874A
公开(公告)日:2024-01-30
申请号:CN202311392230.2
申请日:2023-10-25
Applicant: 上海工程技术大学
IPC: H04N19/105 , H04N19/176 , H04N19/91 , H04N19/147 , H04N19/132 , H04N19/124 , H04N19/186 , H04N19/593 , H04N19/70
Abstract: 本发明公开一种高压缩率视频关键帧编码方法,对原始图像下采样得到低分辨率图像,并进行编解码得到低分辨率图像码流和低分辨率重建图像,再对低分辨率重建图像进行插值处理和超分处理得到多帧参考图像;对原始图像、多帧参考图像进行分块处理,将多帧参考图像中的每个编码块与原始图像对应的编码块进行比较,筛选出最优参考块;同时采用现有帧内编码方法对原始图像进行预测编码,得到M种帧内空间预测块,并选出最优空间预测图像块;根据率失真优化代价从最优参考图像预测块、最优空间预测图像块选择最优预测图像块,再将最优预测图像块与原始图像对应编码块做差获得最优残差图像块,对残差图像块变换、量化和熵编码后输出原始图像分辨率码流,最后将原始图像分辨率码流和低分辨率图像码流合起来作为最终编码流输出。
-
公开(公告)号:CN114866782A
公开(公告)日:2022-08-05
申请号:CN202210281524.7
申请日:2022-03-21
Applicant: 上海工程技术大学
IPC: H04N19/48 , H04N19/147 , H04N19/80
Abstract: 本发明涉及一种基于深度变维码率控制的视频图像处理方法,包括:步骤S1、将原始高分辨率图像进行双三次下采样和低通滤波,得到平滑滤波图像;步骤S2、利用降维修正网络生成的修正项对平滑滤波图像进行细节修正,得到降维修正图像;步骤S3、采用深度码率控制模型对降维修正图像进行编码;步骤S4、建立并级联率失真卷积网络模型,基于先知图像率失真特性和预测失真图像线性缩放准则,对失真图像线性补偿优化,得到无损降维图像;步骤S5、对无损降维图像进行双三次插值维度还原,得到模糊深维图像;步骤S6、采用升维特征预测网络对升维细节进行预测并优化,得到还原图像。与现有技术相比,本发明具有传输效率高、线性损失小以及码率精度高的优点。
-
公开(公告)号:CN111988641B
公开(公告)日:2022-07-15
申请号:CN202010738851.1
申请日:2020-07-28
Applicant: 上海工程技术大学
IPC: H04N21/236 , H04N21/2368
Abstract: 本发明提供了一种传输流复用音视频时间同步方法,包括:处理视频每一帧码流的DTS和PTS,使视频每一帧码流的DTS以视频帧的时间长度连续累计,使视频每一帧码流的PTS以视频帧的时间长度连续累计;处理音频每一帧码流的DTS和PTS,使音频每一帧码流的DTS以音频帧的时间长度连续累计,使音频每一帧码流的PTS以音频帧的时间长度连续累计;根据音频帧与视频帧时间同步情况,判断处理后的时间:若音频帧原始DTS与视频帧原始DTS之间的时间差小于第一阈值,则音视频帧处在同步状态,保持音视频时间一致调整;进入复用器进行复用。
-
公开(公告)号:CN114202505A
公开(公告)日:2022-03-18
申请号:CN202111254893.9
申请日:2021-10-27
Applicant: 上海工程技术大学
IPC: G06T7/00 , G06V10/32 , G06V10/56 , G06V10/25 , G06V10/80 , G06V10/774 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明涉及智能识别的技术领域,公开了一种用于风机叶片表面缺陷的检测方法,搜集叶片图像并进行预处理,手动标注包含在其中缺陷的位置和类型,构建叶片表面缺陷数据库;使用Mask R‑CNN算法选取残差网络ResNet‑101和特征金字塔网络FPN作为骨架网络构建神经网络模型,其中,残差网络ResNet‑101用于对叶片图像进行特征提取,特征金字塔网络FPN用于对提取的特征进行融合;将叶片表面缺陷数据库的叶片图像分为训练集合和测试集,用所述训练集对构建好的神经网络模型进行训练,然后再利用测试集对神经网络模型进行测试,完成神经网络模型的训练,最后利用训练好的神经网络模型对待检叶片进行检测。
-
公开(公告)号:CN120050001A
公开(公告)日:2025-05-27
申请号:CN202510190445.9
申请日:2025-02-20
Applicant: 上海工程技术大学
IPC: H04L1/00 , H04L41/16 , H04L41/147
Abstract: 本发明公开了一种基于链路感知的自适应调整流媒体传输方法,属于卫星通信网络技术领域。包括:获取卫星网络的历史链路状态信息,并进行预处理;根据所述预处理后的历史链路状态信息提取卫星网络的链路状态特征;构建神经网络预测模型并训练,得到训练好的神经网络预测模型;实时采集卫星网络当前的链路状态信息,输入训练好的神经网络预测模型,获取未来链路状态的预测结果;根据所述预测结果动态调整FEC中的编码策略及编码参数。本发明实时收集卫星网络的状态参数,并利用神经网络对卫星链路进行预测,提前优化FEC参数,可以显著提高链路状态预测的准确性和实时性。
-
公开(公告)号:CN117750038A
公开(公告)日:2024-03-22
申请号:CN202311513007.9
申请日:2023-11-14
Applicant: 上海工程技术大学
IPC: H04N19/88 , H04N19/184 , H04N19/169 , H04N19/40
Abstract: 本发明公开了一种低码率视频传输流复用及解复用方法,属于音视频传输流复用技术领域。包括:接收视频数据;构建自定义码流,得到新的视频数据帧;如果当前所述新的视频数据帧是I帧,则将该所述新的视频数据帧单独按照基本码流PES格式打包复用;如果当前所述新的视频数据帧为非I帧,则根据预先构建的视频传输流复用模型,得到最优复用帧数n;将包含当前所述新的视频数据帧在内的连续n帧所述新的视频数据帧合并打包复用;重复上述步骤直至完成所有所述新的视频数据帧的打包复用,最后封装输出。本发明通过在每个视频帧前增加一个自定义码流,然后建立模型寻找最优合并帧数进行合并,减小了每帧无意义的填充数据,提高了传输效率。
-
公开(公告)号:CN115834901A
公开(公告)日:2023-03-21
申请号:CN202211248879.2
申请日:2022-10-12
Applicant: 上海工程技术大学
Abstract: 本发明公开一种音视频转码传输流复用方法,在音视频转码过程中,音视频解码重新编码后形成音视频码流再进入复用器,复用器经由下述步骤逐个输出TS包形成TS传输流,S11若当前系统时间与最近音频包输出的时间之差大于音频包时间间隔,则输出当前音频包,转向执行步骤S13;否则停止音频包输出,执行步骤S12;S12计算当前视频帧的DTS时间与参考PCR时间的时间差,若所述时间差小于视频异常门限值,则输出当前视频包;否则执行视频帧异常检测,根据异常检测结果对当前视频帧进行异常标记,并输出当前视频包;S13对音频帧的DTS、PTS时间及实际PCR时间、参考PCR时间进行调整更新。
-
公开(公告)号:CN115695798A
公开(公告)日:2023-02-03
申请号:CN202211345019.0
申请日:2022-10-31
Applicant: 上海工程技术大学
Abstract: 本发明提供一种可分级VVC快速编码单元划分决策方法及装置,所述方法包括:使用Canny算子提取CU中的边缘,得到垂直边缘特征值与水平边缘特征值;对垂直边缘特征值与水平边缘特征值进行二次处理;计算边缘垂直方向特征和与边缘水平方向特征,得到边缘特征比值;根据所述边缘特征比值确定编码单元划分决策模式。本发明利用边缘方向特征比值对划分模式做提前预决策,极大地节省了VVC编码时间。
-
公开(公告)号:CN114051137A
公开(公告)日:2022-02-15
申请号:CN202111193953.0
申请日:2021-10-13
Applicant: 上海工程技术大学
IPC: H04N19/105 , H04N19/119
Abstract: 本发明属于编解码的技术领域,公开了一种空间可分级视频编码方法,以视频图像中的各帧图像作为原始图像,将原始图像采用下采样方法得到各级增强层图像和基本层图像,其中,基本层图像为最下层,其他层为增强层图像;对基本层图像采用已有视频编码标准进行编码,输出基本层编码数据流,然后,采用图像超分技术和图像复原技术,计算当前增强层图像编码时需要的两个参考图像,从下至上逐一对各级增强层图像进行编码,输出各级增强层编码数据流,逐帧完成视频图像的编码。还公开了一种空间可分级视频图像解码方法。
-
公开(公告)号:CN111988641A
公开(公告)日:2020-11-24
申请号:CN202010738851.1
申请日:2020-07-28
Applicant: 上海工程技术大学
IPC: H04N21/236 , H04N21/2368
Abstract: 本发明提供了一种传输流复用音视频时间同步方法,包括:处理视频每一帧码流的DTS和PTS,使视频每一帧码流的DTS以视频帧的时间长度连续累计,使视频每一帧码流的PTS以视频帧的时间长度连续累计;处理音频每一帧码流的DTS和PTS,使音频每一帧码流的DTS以音频帧的时间长度连续累计,使音频每一帧码流的PTS以音频帧的时间长度连续累计;根据音频帧与视频帧时间同步情况,判断处理后的时间:若音频帧原始DTS与视频帧原始DTS之间的时间差小于第一阈值,则音视频帧处在同步状态,保持音视频时间一致调整;进入复用器进行复用。
-
-
-
-
-
-
-
-
-