-
公开(公告)号:CN116206356A
公开(公告)日:2023-06-02
申请号:CN202111443162.9
申请日:2021-11-30
Applicant: 富士通株式会社
Abstract: 本申请实施例提供一种行为识别装置和方法以及电子设备。所述方法包括:对图像中的物体进行检测以获得物体检测框;使用轻量级网络并基于所述物体检测框进行姿势估计,获得所述物体的多个关键点;其中,所述轻量级网络的骨干网络为MobileNet网络结构,并且所述轻量级网络还包括与所述MobileNet网络结构连接的上采样模块;以及基于所述多个关键点对所述物体的行为进行识别。由此,能够加速姿势估计的速度,不仅能够提高行为识别结果的准确性,而且能够实时地进行行为识别。
-
公开(公告)号:CN113727141A
公开(公告)日:2021-11-30
申请号:CN202010431003.6
申请日:2020-05-20
Applicant: 富士通株式会社
IPC: H04N21/234 , H04N21/2343 , H04N21/44 , H04N21/4402
Abstract: 本申请实施例提供一种视频帧的插值装置以及方法。所述方法包括:计算第一帧和第二帧之间的双向光流;根据所述第一帧和所述第二帧进行核和权重估计;其中,使用一个卷积层生成自适应局部卷积核并且使用另一个卷积层生成权重系数;根据所述双向光流、所述权重系数和所述自适应局部卷积核,使用自适应变换层对所述第一帧和所述第二帧进行变换以生成变换帧;以及对所述第一帧和所述第二帧、所述变换帧进行帧合成,以生成所述第一帧和所述第二帧之间的插值帧。
-
公开(公告)号:CN111988629A
公开(公告)日:2020-11-24
申请号:CN201910429351.7
申请日:2019-05-22
Applicant: 富士通株式会社
Abstract: 本申请实施例提供一种图像编码方法和装置、图像解码方法和装置。图像编码方法包括:利用卷积神经网络对待处理的图像数据进行特征提取,生成图像数据的特征图;对特征图进行量化,生成离散的特征图;对离散的特征图进行预处理,生成预处理数据,预处理数据的数据量小于离散的特征图的数据量;根据预处理数据计算离散的特征图中的待编码数据的概率;根据待编码数据的概率对待编码数据进行熵编码。
-
公开(公告)号:CN111988629B
公开(公告)日:2024-02-09
申请号:CN201910429351.7
申请日:2019-05-22
Applicant: 富士通株式会社
IPC: H04N19/91 , H04N19/136 , H04N19/42 , H04N19/44 , G06N3/0464 , G06N3/0499 , G06N3/08
Abstract: 本申请实施例提供一种图像编码方法和装置、图像解码方法和装置。图像编码方法包括:利用卷积神经网络对待处理的图像数据进行特征提取,生成图像数据的特征图;对特征图进行量化,生成离散的特征图;对离散的特征图进行预处理,生成预处理数据,预处理数据的数据量小于离散的特征图的数据量;根据预处理数据计算离散的特征图中的待编码数据的概率;根据待编码数据的概率对待编码数据进行熵编码。
-
公开(公告)号:CN113727141B
公开(公告)日:2023-05-12
申请号:CN202010431003.6
申请日:2020-05-20
Applicant: 富士通株式会社
IPC: H04N21/234 , H04N21/2343 , H04N21/44 , H04N21/4402
Abstract: 本申请实施例提供一种视频帧的插值装置以及方法。所述方法包括:计算第一帧和第二帧之间的双向光流;根据所述第一帧和所述第二帧进行核和权重估计;其中,使用一个卷积层生成自适应局部卷积核并且使用另一个卷积层生成权重系数;根据所述双向光流、所述权重系数和所述自适应局部卷积核,使用自适应变换层对所述第一帧和所述第二帧进行变换以生成变换帧;以及对所述第一帧和所述第二帧、所述变换帧进行帧合成,以生成所述第一帧和所述第二帧之间的插值帧。
-
公开(公告)号:CN113438481A
公开(公告)日:2021-09-24
申请号:CN202010208845.5
申请日:2020-03-23
Applicant: 富士通株式会社
IPC: H04N19/13 , H04N19/124 , H04N19/184 , H04N21/2343 , H04N21/4402
Abstract: 本申请实施例提供一种训练方法、图像编码方法、图像解码方法及装置。图像编码装置包括:图像编码器,其对输入的图像数据进行编码得到潜在变量;量化器,其根据量化步长对所述潜在变量进行量化处理,生成量化的潜在变量;以及熵编码器,其使用熵模型对量化的潜在变量进行熵编码,形成码流。
-
公开(公告)号:CN111988609A
公开(公告)日:2020-11-24
申请号:CN201910429870.3
申请日:2019-05-22
Applicant: 富士通株式会社
Abstract: 本申请实施例提供了一种图像编码装置、概率模型生成装置和图像解码装置,图像编码装置包括:第一特征提取单元,其对输入图像进行特征提取,得到N个通道的特征图;第二特征提取单元,其对调整了K次大小的输入图像进行特征提取,分别得到N个通道的特征图;第一连接单元,其将来自所述第一特征提取单元的N个通道的特征图与来自所述第二特征提取单元的K×N个通道的特征图连接并输出。由此,可以准确地提取图像的特征并获得更具竞争性的潜在表示。
-
-
-
-
-
-