-
公开(公告)号:CN117714689A
公开(公告)日:2024-03-15
申请号:CN202311594930.X
申请日:2023-11-27
Applicant: 中国科学院计算技术研究所
IPC: H04N19/132 , H04N19/136 , G06V20/40 , G06V10/762 , G06V10/774 , G06V10/74 , G06N3/0464 , G06N3/08
Abstract: 本发明提供了一种用于压缩视频的关键帧的提取方法,所述方法包括以下步骤:获取视频中的所有视频帧以及所需关键帧的预设数量;其中,所述视频的最后一帧作为固定的关键帧;利用经训练的嵌入模型提取所述视频中除最后一帧外的视频帧的特征向量;根据所述预设数量确定聚类簇的数量,根据所述聚类簇的数量以及除最后一帧外的视频帧的特征向量对视频帧进行聚类,得到每个视频帧所属的聚类簇;从每个聚类簇中提取一个用于压缩视频的非固定的关键帧,将所述固定的关键帧以及所述非固定的关键帧作为用于压缩所述视频的关键帧。
-
公开(公告)号:CN113938685B
公开(公告)日:2023-04-11
申请号:CN202111129745.4
申请日:2021-09-26
Applicant: 中国科学院计算技术研究所
IPC: H04N19/42 , H04N19/124 , H04N19/149 , H04N19/182
Abstract: 本发明提出一种面向大规模图像存储的认知型软件可调整图像编码装置,包括:模块1,用于获取待编码图像集的基本信息,该参数信息包括:待编码图像集的规模、每张待编码图像的尺寸和每张待编码图像的色深;模块2,用于挖掘并构建图像的深层信息,所述深层信息包括:每张待编码图像的内容画像、待编码图像集的整体画像、编码器所处的环境画像;模块3,用于对该基本信息和该深层信息进行整合,并结合该编码装置中编码器的可调整的编码参数,构建数学模型;模块4,用于求解该数学模型,得到最优编码参数,并以该最优编码参数对该待编码图像集进行编码。相较现有的图像编码方法,本发明有效降低图像存储空间,节省存储运算成本。
-
公开(公告)号:CN113938684A
公开(公告)日:2022-01-14
申请号:CN202111128475.5
申请日:2021-09-26
Applicant: 中国科学院计算技术研究所
IPC: H04N19/42 , H04N19/182 , H04N19/184 , H04N19/149
Abstract: 本发明提出了一种轻量级端云协同的图像编码传输方法和系统,包括获取包括多幅图像的图像集,以及用于对图像进行压缩编码的编码器,并获取移动端的配置参数;集合图像集中每一幅图像的画面质量与编码器参数及配置参数之间的映射关系,作为映射表,映射关系为图像经不同编码器编码后对应在不同配置参数的移动端显示的画面质量;根据映射表,将每幅图像在不同编码器参数下的编码结果作为一组,将图像集的压缩编码问题作为分组背包问题并求解;基于求解结果,指导图像集中的每个图像针对不同编码器及移动端完成压缩编码。本发明针对性地进行图像压缩及传输,在延迟、分辨率、比特率等限制以及图像效果目标下得到最优图像编码传输方案。
-
公开(公告)号:CN119131419A
公开(公告)日:2024-12-13
申请号:CN202411148141.8
申请日:2024-08-21
Applicant: 中国科学院计算技术研究所
IPC: G06V10/70 , G06V10/774 , G06V10/77 , G06N3/0985 , G06N3/0495 , G06V10/44 , G06V10/82
Abstract: 本发明提供一种机器语义载体的选择及端到端训练方法,包括:从视觉信号数据中提取视觉信号表示;利用多种特征提取网络提取所述表示的特征,得到多个特征;从多个特征中选择满足预设限制条件的一个特征作为通用的视觉语义载体,将所述载体对应的特征提取网络作为特征生成器;获取训练集、特征生成器以及任务网络,训练集中每个样本包括输入数据和与机器视觉任务相关的任务标签,输入数据为视觉信号表示;利用训练集训练特征生成器和任务网络,包括对特征生成器提取输入数据的特征得到视觉语义载体进行量化操作,得到量化后的特征,任务网络基于量化后的特征得到预测结果,根据任务标签和预测结果间的差异来更新特征生成器和任务网络的参数。
-
公开(公告)号:CN113938684B
公开(公告)日:2023-04-21
申请号:CN202111128475.5
申请日:2021-09-26
Applicant: 中国科学院计算技术研究所
IPC: H04N19/42 , H04N19/182 , H04N19/184 , H04N19/149
Abstract: 本发明提出了一种轻量级端云协同的图像编码传输方法和系统,包括获取包括多幅图像的图像集,以及用于对图像进行压缩编码的编码器,并获取移动端的配置参数;集合图像集中每一幅图像的画面质量与编码器参数及配置参数之间的映射关系,作为映射表,映射关系为图像经不同编码器编码后对应在不同配置参数的移动端显示的画面质量;根据映射表,将每幅图像在不同编码器参数下的编码结果作为一组,将图像集的压缩编码问题作为分组背包问题并求解;基于求解结果,指导图像集中的每个图像针对不同编码器及移动端完成压缩编码。本发明针对性地进行图像压缩及传输,在延迟、分辨率、比特率等限制以及图像效果目标下得到最优图像编码传输方案。
-
公开(公告)号:CN113938685A
公开(公告)日:2022-01-14
申请号:CN202111129745.4
申请日:2021-09-26
Applicant: 中国科学院计算技术研究所
IPC: H04N19/42 , H04N19/124 , H04N19/149 , H04N19/182
Abstract: 本发明提出一种面向大规模图像存储的认知型软件可调整图像编码装置,包括:模块1,用于获取待编码图像集的基本信息,该参数信息包括:待编码图像集的规模、每张待编码图像的尺寸和每张待编码图像的色深;模块2,用于挖掘并构建图像的深层信息,所述深层信息包括:每张待编码图像的内容画像、待编码图像集的整体画像、编码器所处的环境画像;模块3,用于对该基本信息和该深层信息进行整合,并结合该编码装置中编码器的可调整的编码参数,构建数学模型;模块4,用于求解该数学模型,得到最优编码参数,并以该最优编码参数对该待编码图像集进行编码。相较现有的图像编码方法,本发明有效降低图像存储空间,节省存储运算成本。
-
-
-
-
-