-
-
公开(公告)号:CN113792630B
公开(公告)日:2023-11-07
申请号:CN202111010548.0
申请日:2021-08-31
Applicant: 北京大学
IPC: G06V20/10 , G06V10/764 , G06V10/74 , G06V10/82 , G06N3/09
Abstract: 本发明公开一种基于对比学习的外星地表图像识别方法及系统,属于图像识别领域,通过搭建图像识别模型,并对该模型进行类间对比学习和相似性学习训练,来识别外星地表图像。本发明能够在不引入额外人类监督的条件下,使模型自适应学习新样本类型与数据域分布,进而兼容未知环境,更加准确地识别外星地表图像,满足探索应用需求。
-
公开(公告)号:CN113537456B
公开(公告)日:2023-10-17
申请号:CN202110660867.X
申请日:2021-06-15
Applicant: 北京大学
IPC: G06N3/0464 , G06N3/048 , G06N3/082 , G06N3/084 , G06V10/764 , G06V10/82
Abstract: 本发明公开了一种深度特征压缩方法,本发明构建并训练一压缩模型,该模型首先对神经网络提取的图像特征表示进行变换,产生变换后的紧凑表示,提取变换后的表示的超先验码流;超先验码流用于产生码本各个基元素的线性组合系数;码本从特征中学习获得;根据线性组合系数和对应的码本产生超先验概率估计,从而使用熵编码器进行熵编码,产生码流;码流通过熵解码和解码变换产生输出的特征表示。本发明能够对深度特征进行有效压缩,而且能够对多个任务特征进行协同压缩,重建时,对特征进行分离操作,分别产生对应不同任务的重建特征;本发明还能够支持训练时未见的新任务。
-
公开(公告)号:CN113132727B
公开(公告)日:2022-07-22
申请号:CN201911393847.X
申请日:2019-12-30
Applicant: 北京大学
IPC: H04N19/124 , H04N19/172 , H04N19/42 , H04N19/44 , H04N19/70 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于图像生成的可伸缩机器视觉编码方法,其步骤包括:构建一运动引导图像生成网络;训练神经网络:每次迭代时,从视频序列中选取关键帧与待编码帧及对应的关键点数据并输入网络,计算出关键帧和待编码帧的关键点;根据关键帧与待编码帧的关键点差别进行运动估计;根据估计所得运动以及关键帧获得待编码帧的重建帧;计算关键点位置的预测结果与关键点实际位置之间的预测误差以及计算待编码帧与其重建帧的重建误差,并将其反向传播到网络直到网络收敛;编码阶段:将待处理视频序列的每一帧输入训练后的运动引导图像生成网络,计算每一帧中的关键点的位置信息并进行量化压缩;解码阶段根据码流和任务进行图像重建。
-
公开(公告)号:CN110796607B
公开(公告)日:2022-07-22
申请号:CN201810876683.5
申请日:2018-08-03
Applicant: 北京大学
Abstract: 本发明公开了一种基于视网膜大脑皮层理论的深度学习低光照图像增强方法,其步骤包括:通过一个分解网络将待提亮低光照图片分解成本质和光照,在本质上进行噪声去除,将光照和本质输入一个提亮网络得到提亮后的光照,将提亮后的光照和去除噪声后的本质相乘得到最后的正常光照图片。本发明能够端对端地学习提亮低光照图像,通过机器学习方法能够取得更为精确的光照本质分解和更自然适用范围更广的提亮结果。
-
公开(公告)号:CN113347422B
公开(公告)日:2022-07-12
申请号:CN202110521800.8
申请日:2021-05-13
Applicant: 北京大学
IPC: H04N19/13 , H04N19/176 , H04N19/50
Abstract: 本发明公开了一种粗粒度上下文熵编码方法。本方法为:1)从图像数据集中选取一原始图像并送入神经网络的编码器中进行编码;2)对编码后的张量进行划分;将每一子张量视为一待编码块;3)熵编码网络对每一待编码块进行上下文熵编码,获得待编码块的上下文信息;4)将每一上下文信息送入概率预测网络中,获得对应待编码块所有元素的概率分布参数;5)根据概率分布参数计算张量信息熵;将张量送入解码器,得到解码重建图像并计算失真项损失函数的损失值;6)根据步骤5)所得结果计算率失真损失函数的损失值并反向传播到神经网络各层;7)重复步骤1)‑6)直到神经网络收敛;8)将目标图像送入训练后的神经网络得到目标图像的编码。
-
公开(公告)号:CN114419724A
公开(公告)日:2022-04-29
申请号:CN202011074346.8
申请日:2020-10-09
Applicant: 北京大学
IPC: G06V40/20 , G06V10/774 , G06V10/776 , G06V10/82 , G06K9/62 , G06N3/04
Abstract: 本发明公开了一种基于多任务自监督学习的动作识别方法及电子装置,包括:使用编码器对待识别动作数据进行编码;对编码后的数据进行分类,将概率最大的类别判定为待识别动作数据的动作类别;其中,编码器进行训练时的自监督任务包括:动作预测自监督任务、拼图自监督任务和对比学习自监督任务。本发明设计了适用于动作数据的自监督任务以及训练策略,并通过多种自监督任务,提升动作数据的动作识别准确率。
-
公开(公告)号:CN113132755B
公开(公告)日:2022-04-01
申请号:CN201911415561.7
申请日:2019-12-31
Applicant: 北京大学
IPC: H04N21/2343 , H04N21/4402 , H04N19/132 , H04N19/13
Abstract: 本发明公开了一种可扩展人机协同图像编码方法及编码系统。本方法为:提取各样本图片的边缘图并矢量化,作为驱动机器视觉任务的紧凑表示;在矢量化后的边缘图中进行关键点提取作为辅助信息;对紧凑表示和辅助信息分别进行熵编码无损压缩,获得两路码流;对两路码流进行初步解码,获得边缘图以及辅助信息;将解码得到的边缘图以及辅助信息输入生成神经网络中,进行网络的前向计算;根据得到的计算结果与对应原始图片进行损失函数计算,并将计算的损失反向传播到神经网络进行网络权值更新直到神经网络收敛,得到双路码流解码器;获取待处理图像的边缘图和辅助信息并编码压缩后得到两路码流;双路码流解码器对收到的码流解码,重建图像。
-
公开(公告)号:CN113496460A
公开(公告)日:2021-10-12
申请号:CN202010258460.X
申请日:2020-04-03
Applicant: 北京大学 , 北京字节跳动科技有限公司
Abstract: 本发明公开一种基于特征调整的神经风格迁移方法及系统,属于图像与视频风格化领域,训练主要由内容编码器、风格编码器、装饰器和解码器组成的神经风格迁移网络模型,输入目标内容图像或视频帧和参考风格图像,得到风格迁移结果图像或视频帧,通过调整神经网络的特征空间与通道两个维度的分布,只需要一次参数前传就可以实现效果良好的风格迁移。
-
公开(公告)号:CN113347422A
公开(公告)日:2021-09-03
申请号:CN202110521800.8
申请日:2021-05-13
Applicant: 北京大学
IPC: H04N19/13 , H04N19/176 , H04N19/50
Abstract: 本发明公开了一种粗粒度上下文熵编码方法。本方法为:1)从图像数据集中选取一原始图像并送入神经网络的编码器中进行编码;2)对编码后的张量进行划分;将每一子张量视为一待编码块;3)熵编码网络对每一待编码块进行上下文熵编码,获得待编码块的上下文信息;4)将每一上下文信息送入概率预测网络中,获得对应待编码块所有元素的概率分布参数;5)根据概率分布参数计算张量信息熵;将张量送入解码器,得到解码重建图像并计算失真项损失函数的损失值;6)根据步骤5)所得结果计算率失真损失函数的损失值并反向传播到神经网络各层;7)重复步骤1)‑6)直到神经网络收敛;8)将目标图像送入训练后的神经网络得到目标图像的编码。
-
-
-
-
-
-
-
-
-