-
公开(公告)号:CN113132727B
公开(公告)日:2022-07-22
申请号:CN201911393847.X
申请日:2019-12-30
Applicant: 北京大学
IPC: H04N19/124 , H04N19/172 , H04N19/42 , H04N19/44 , H04N19/70 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于图像生成的可伸缩机器视觉编码方法,其步骤包括:构建一运动引导图像生成网络;训练神经网络:每次迭代时,从视频序列中选取关键帧与待编码帧及对应的关键点数据并输入网络,计算出关键帧和待编码帧的关键点;根据关键帧与待编码帧的关键点差别进行运动估计;根据估计所得运动以及关键帧获得待编码帧的重建帧;计算关键点位置的预测结果与关键点实际位置之间的预测误差以及计算待编码帧与其重建帧的重建误差,并将其反向传播到网络直到网络收敛;编码阶段:将待处理视频序列的每一帧输入训练后的运动引导图像生成网络,计算每一帧中的关键点的位置信息并进行量化压缩;解码阶段根据码流和任务进行图像重建。
-
公开(公告)号:CN112069769A
公开(公告)日:2020-12-11
申请号:CN201910440039.8
申请日:2019-05-24
Applicant: 北京大学
IPC: G06F40/109
Abstract: 本发明提出一种针对特效字的智能字效迁移方法,包括以下步骤:利用训练数据集,训练遮罩提取子网络进行装饰元素遮罩的提取,训练基础特效迁移子网络进行基础文字特效迁移;将带有装饰元素的特效字Dy和其配对字形图片Cy到训练好的遮罩提取子网络中,得到装饰元素遮罩My;将Dy及其配对字形图片Cy、目标字形图片Cx输入到训练好的基础特效迁移子网络中,得到基础特效迁移和装饰元素消除的结果Sx;利用My,Cy和Cx进行元素重组,将装饰元素融合在Sx上,得到目标字形对应的迁移后的带有装饰元素的特效字Dx。本方法能够在迁移文字特效的同时迁移其装饰元素,且不会导致装饰元素的丢失和扭曲。
-
公开(公告)号:CN112651898B
公开(公告)日:2023-04-07
申请号:CN202110034912.0
申请日:2021-01-12
Applicant: 北京大学
IPC: G06T5/00 , G06N3/0442 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于记忆增强的视频去雨方法与装置,其步骤包括:1)将卷积长短期记忆网络的内部状态作为全局长期记忆;对于待去雨处理的目标视频,将该目标视频的前n帧分别输入记忆增强去雨网络,获得各帧对应的去雨结果;2)对于该目标视频的第n帧之后的每一帧,执行步骤a)~c),获得该目标视频对应的去雨视频:a)将当前待去雨帧的前多帧的去雨结果、全局长期记忆、当前待去雨帧输入记忆增强去雨网络进行去雨,得到当前帧的去雨结果;b)计算当前待去雨帧与其去雨结果之间的差值,作为当前待去雨帧的雨痕图;c)将雨痕图输入卷积长短期记忆网络,更新该卷积长短期记忆网络的内部状态作为新的全局长期记忆。
-
公开(公告)号:CN114363624B
公开(公告)日:2023-03-31
申请号:CN202011090817.4
申请日:2020-10-13
Applicant: 北京大学
Abstract: 本发明公开了一种基于敏感度的码率分配特征压缩方法,其步骤包括:1)将图像的神经网络中间层特征输入深层神经网络进行计算,得到无损网络输出;2)对于所述神经网络中间层特征的每一单通道i,进行如下处理:为单通道i对应的特征施加编码噪声,得到该单通道i的加噪特征;然后将单通道i的加噪特征输入深层神经网络进行计算,得到单通道i的加噪输出;然后计算单通道i的加噪输出与所述无损网络输出的差值,作为单通道i的编码噪声敏感度;3)根据各单通道的编码噪声敏感度进行码率分配,为每个单通道分配压缩质量参数;4)根据各单通道分配所得的压缩质量参数,对量化后的所述神经网络中间层特征进行压缩,得到中间层特征压缩码流。
-
公开(公告)号:CN113573076A
公开(公告)日:2021-10-29
申请号:CN202010358452.2
申请日:2020-04-29
IPC: H04N19/51 , H04N19/587 , H04N19/90 , G06N3/04
Abstract: 本申请涉及人工智能领域中的视频编码技术,提供一种视频编码的方法和装置,能够生成更准确的预测帧,进而提高视频编码效率。该视频编码的方法包括:获取视频序列中待编码的第一视频帧之前的固定数量的第二视频帧的重建帧;根据所述第二视频帧的重建帧和所述视频序列的全局长期记忆,生成所述第一视频帧的合成参考帧,其中,所述全局长期记忆是根据所述视频序列中的所述第一视频帧之前的多个视频帧中的每个视频帧的重建帧和所述每个视频帧的合成参考帧确定的;根据所述第一视频帧的合成参考帧,对所述第一视频帧进行编码。由于该合成参考帧具有描述视频序列之间复杂的运动的能力,因此本申请实施例能够生成更准确的预测帧,提高视频编码效率。
-
公开(公告)号:CN112785523A
公开(公告)日:2021-05-11
申请号:CN202110088761.7
申请日:2021-01-22
Applicant: 北京大学
Abstract: 本发明公开了一种子带网络桥接的半监督图像去雨方法及装置,通过深度学习来进行雨天图像的半监督学习,提出了一种递归频带表示来连接无监督和全监督框架。本文提取出一系列由粗到精的频带表示,并通过递归的端到端学习进行增强,进行雨痕去除和细节修正。在感知质量引导的对抗学习下,使用深度频带表示进行重构,生成最终的复原结果。本发明提取出一系列由粗到精的频带表示,并通过递归的端到端学习进行增强,进行雨痕去除和细节修正,提出了一种递归频带表示来连接无监督和全监督框架。
-
公开(公告)号:CN112634178A
公开(公告)日:2021-04-09
申请号:CN202110041992.2
申请日:2021-01-13
Applicant: 北京大学
Abstract: 本发明公开了一种基于双向时域一致的视频去雨方法与装置。本方法为:1)收集雨天视频数据并将其划分为多个片段;2)搭建去雨模型并进行训练,模型包括由外至内去雨网络和由内至外预测网络;其中,对于每一片段,第一阶段:由内向外去雨网络首先分别估计该训练样本中间一帧的前后相邻帧到该帧的光流,并基于光流对相邻帧的运动补偿结果计算当前帧的粗去雨结果;再根据补偿结果以及粗去雨结果计算当前帧的精细去雨结果;第二阶段:由内向外预测网络利用光流和当前帧的精细去雨结果预测当前帧的相邻帧,并对相邻帧的预测结果和其真实值之间施加一致性约束,构成时序一致损失函数;3)利用训练后的模型对视频进行去雨,获得去雨后的视频。
-
公开(公告)号:CN112785523B
公开(公告)日:2023-10-17
申请号:CN202110088761.7
申请日:2021-01-22
Applicant: 北京大学
IPC: G06T5/00 , G06V10/774 , G06N3/0464
Abstract: 本发明公开了一种子带网络桥接的半监督图像去雨方法及装置,通过深度学习来进行雨天图像的半监督学习,提出了一种递归频带表示来连接无监督和全监督框架。本文提取出一系列由粗到精的频带表示,并通过递归的端到端学习进行增强,进行雨痕去除和细节修正。在感知质量引导的对抗学习下,使用深度频带表示进行重构,生成最终的复原结果。本发明提取出一系列由粗到精的频带表示,并通过递归的端到端学习进行增强,进行雨痕去除和细节修正,提出了一种递归频带表示来连接无监督和全监督框架。
-
公开(公告)号:CN113132727A
公开(公告)日:2021-07-16
申请号:CN201911393847.X
申请日:2019-12-30
Applicant: 北京大学
IPC: H04N19/124 , H04N19/172 , H04N19/42 , H04N19/44 , H04N19/70 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于图像生成的可伸缩机器视觉编码方法,其步骤包括:构建一运动引导图像生成网络;训练神经网络:每次迭代时,从视频序列中选取关键帧与待编码帧及对应的关键点数据并输入网络,计算出关键帧和待编码帧的关键点;根据关键帧与待编码帧的关键点差别进行运动估计;根据估计所得运动以及关键帧获得待编码帧的重建帧;计算关键点位置的预测结果与关键点实际位置之间的预测误差以及计算待编码帧与其重建帧的重建误差,并将其反向传播到网络直到网络收敛;编码阶段:将待处理视频序列的每一帧输入训练后的运动引导图像生成网络,计算每一帧中的关键点的位置信息并进行量化压缩;解码阶段根据码流和任务进行图像重建。
-
公开(公告)号:CN112614073A
公开(公告)日:2021-04-06
申请号:CN202011593324.2
申请日:2020-12-29
Applicant: 北京大学
Abstract: 本发明公开了一种基于视觉质量评价反馈的图像去雨方法及电子装置,包括基于若干样本无雨图像及生成的雨痕与雨雾,构建成对图像数据集;将搜集的样本雨天图像进行去雨处理,并对各处理后样本雨天图像进行人工视觉质量评估,构建非成对雨天图像质量数据集;利用非成对雨天图像质量数据集,训练第一卷积神经网络,得到质量评估网络;使用成对图像数据集和质量评估网络约束,训练第二卷积神经网络,得到图像去雨模型;将待处理图像输入图像去雨模型,得到去雨后的图像。本发明使用了真实的雨天图像参与模型训练,使模型能学习到处理更加丰富和真实的降质类型,引入了视觉质量评价反馈,使生成的去雨图像具有人眼主观意义上更好的质量。
-
-
-
-
-
-
-
-
-