-
公开(公告)号:CN111988609B
公开(公告)日:2024-07-16
申请号:CN201910429870.3
申请日:2019-05-22
Applicant: 富士通株式会社
IPC: H04N19/136 , H04N19/42 , H04N19/44 , H04N19/91 , G06N3/0464 , G06N3/0455 , G06N3/08
Abstract: 本申请实施例提供了一种图像编码装置、概率模型生成装置和图像解码装置,图像编码装置包括:第一特征提取单元,其对输入图像进行特征提取,得到N个通道的特征图;第二特征提取单元,其对调整了K次大小的输入图像进行特征提取,分别得到N个通道的特征图;第一连接单元,其将来自所述第一特征提取单元的N个通道的特征图与来自所述第二特征提取单元的K×N个通道的特征图连接并输出。由此,可以准确地提取图像的特征并获得更具竞争性的潜在表示。
-
公开(公告)号:CN111986278B
公开(公告)日:2024-02-06
申请号:CN201910429115.5
申请日:2019-05-22
Applicant: 富士通株式会社
IPC: H04N19/13 , H04N19/136 , H04N19/172 , H04N19/169 , H04N19/91 , G06T9/00
Abstract: 本申请实施例提供了一种图像编码方法、装置和图像压缩系统,图像编码装置包括:第一特征提取单元,其对输入图像进行特征提取,得到N个通道的特征图;加权单元,其对各个通道的特征图分配权重;以及第二特征提取单元,其对所述加权单元处理后的特征图进行降维处理,得到M个通道的特征图输出,M小于N。由此,通过对不同的特征图乘以一个权重来获得对应的重要性,然后通过所述第二特征提取单元将加权单元处理后的特征图降维,减少解码时间。
-
公开(公告)号:CN117409472A
公开(公告)日:2024-01-16
申请号:CN202210783193.7
申请日:2022-07-05
Applicant: 富士通株式会社
Abstract: 本申请实施例提供一种姿态估计装置和方法以及电子设备。该姿态估计装置包括:提取单元,其提取图像中的特征;维度变换单元,其对提取的所述特征进行升维处理,并对所述升维处理后的结果进行降维处理;以及估计单元,其基于所述降维处理后的结果进行姿态估计,并输出姿态估计的结果。通过对提取出的图像特征进行升维处理,然后进行降维处理,该升维处理能够增加特征的数量,从而使得网格的信息更加精确,能够得到更为精确的姿态估计结果。
-
公开(公告)号:CN111986278A
公开(公告)日:2020-11-24
申请号:CN201910429115.5
申请日:2019-05-22
Applicant: 富士通株式会社
Abstract: 本申请实施例提供了一种图像编码方法、装置和图像压缩系统,图像编码装置包括:第一特征提取单元,其对输入图像进行特征提取,得到N个通道的特征图;加权单元,其对各个通道的特征图分配权重;以及第二特征提取单元,其对所述加权单元处理后的特征图进行降维处理,得到M个通道的特征图输出,M小于N。由此,通过对不同的特征图乘以一个权重来获得对应的重要性,然后通过所述第二特征提取单元将加权单元处理后的特征图降维,减少解码时间。
-
公开(公告)号:CN118628858A
公开(公告)日:2024-09-10
申请号:CN202310252830.2
申请日:2023-03-07
Applicant: 富士通株式会社
IPC: G06V10/774 , G06V10/40 , G06V10/82 , G06T7/73 , G06N3/0464 , G06N3/08
Abstract: 本申请实施例提供一种三维人体姿态估计模型的训练装置及方法。该方法包括:将包括三维图像数据集的训练数据输入到卷积网络中进行特征提取,得到三维热图;根据该三维热图得到人体关节点的三维坐标;根据该人体关节点的三维坐标,计算人体局部方向的预测值、骨骼长度的预测值以及各个人体关节点与根关节点的相对位置的预测值中的至少一个;根据人体局部方向的预测值、骨骼长度的预测值以及各个人体关节点与根关节点的相对位置的预测值中的至少一个与根据该三维图像数据集计算得到的相应真值,确定损失函数;以及基于该损失函数,对三维人体姿态估计模型的参数进行调整。
-
公开(公告)号:CN111818346B
公开(公告)日:2023-04-18
申请号:CN201910289189.3
申请日:2019-04-11
Applicant: 富士通株式会社
IPC: H04N19/91 , H04N19/124 , G06N3/0455 , G06N3/0464
Abstract: 本发明实施例提供一种图像编码方法和装置、图像解码方法和装置。该图像编码方法包括:对待处理的图像数据进行卷积神经网络编码,生成特征向量或特征图;对所述特征向量或特征图进行量化,生成离散的待编码符号;利用多尺度上下文模型估计所述待编码符号的概率,其中,所述多尺度上下文模型包括多个不同尺度的掩模卷积层;以及根据所述待编码符号的概率进行熵编码。
-
公开(公告)号:CN115471904A
公开(公告)日:2022-12-13
申请号:CN202110647675.5
申请日:2021-06-10
Applicant: 富士通株式会社
Abstract: 本申请实施例提供一种动作识别方法、动作识别装置和电子设备,该动作识别装置包括:第一检测单元,其基于第一模型,检测图像中的人体;第二检测单元,其基于第二模型,检测所述人体上的关键点;第三检测单元,其根据所述关键点,检测所述人体的关节角度;以及第四检测单元,其根据所述关键点的位置和所述关节角度,检测所述人体的动作,所述装置还包括:推理优化单元,其基于推理优化器对所述第一模型和/或第二模型进行推理优化,其中,推理优化后的所述第一模型和/或推理优化后的所述第二模型被用于检测图像中的人体和/或检测所述人体上的关键点。
-
公开(公告)号:CN111818346A
公开(公告)日:2020-10-23
申请号:CN201910289189.3
申请日:2019-04-11
Applicant: 富士通株式会社
IPC: H04N19/91 , H04N19/124 , G06N3/04
Abstract: 本发明实施例提供一种图像编码方法和装置、图像解码方法和装置。该图像编码方法包括:对待处理的图像数据进行卷积神经网络编码,生成特征向量或特征图;对所述特征向量或特征图进行量化,生成离散的待编码符号;利用多尺度上下文模型估计所述待编码符号的概率,其中,所述多尺度上下文模型包括多个不同尺度的掩模卷积层;以及根据所述待编码符号的概率进行熵编码。
-
公开(公告)号:CN118447528A
公开(公告)日:2024-08-06
申请号:CN202310100285.5
申请日:2023-02-06
Applicant: 富士通株式会社
Abstract: 本申请实施例提供一种姿态估计装置和方法,该姿态估计装置包括:提取单元,其使用第一模型从全局输入图像中提取第一特征,和/或使用第二模型从全局输入图像中的局部输入图像中提取第二特征;处理单元,其对所述第一特征和/或所述第二特征进行处理,得到第三特征;估计单元,其基于所述第三特征进行姿态估计,并输出姿态估计的结果,由此,在提取特征阶段能够获取更多的全局信息,能够得到更为精确的姿态估计结果。
-
公开(公告)号:CN113438481B
公开(公告)日:2024-04-12
申请号:CN202010208845.5
申请日:2020-03-23
Applicant: 富士通株式会社
IPC: H04N19/13 , H04N19/124 , H04N19/184 , H04N21/2343 , H04N21/4402
Abstract: 本申请实施例提供一种训练方法、图像编码方法、图像解码方法及装置。图像编码装置包括:图像编码器,其对输入的图像数据进行编码得到潜在变量;量化器,其根据量化步长对所述潜在变量进行量化处理,生成量化的潜在变量;以及熵编码器,其使用熵模型对量化的潜在变量进行熵编码,形成码流。
-
-
-
-
-
-
-
-
-