-
公开(公告)号:CN118736661A
公开(公告)日:2024-10-01
申请号:CN202310332523.5
申请日:2023-03-30
Applicant: 富士通株式会社
Abstract: 本申请实施例提供一种动作识别装置和方法以及电子设备。所述方法包括:通过神经网络对图像中的对象进行关键点识别,获取所述对象的关键点;以及根据获取的所述关键点中的鼻子关键点与左肩关键点之间的第一距离、所述鼻子关键点与右肩关键点之间的第二距离以及所述左肩关键点和所述右肩关键点之间的第三距离,确定所述对象的注视方向。由此,能够提高动作识别结果的准确性。
-
公开(公告)号:CN118736660A
公开(公告)日:2024-10-01
申请号:CN202310331449.5
申请日:2023-03-30
Applicant: 富士通株式会社
Abstract: 本申请实施例提供一种动作识别装置和方法以及电子设备。所述方法包括:通过神经网络对图像中的对象进行关键点识别,获取所述对象的关键点;以及根据获取的所述关键点中的左肩关键点和右肩关键点的第一连线与肘部关键点和腕部关键点的第二连线之间的夹角,确定所述对象的指向方向,其中,所述肘部关键点与所述腕部关键点位于同侧。由此,能够提高动作识别结果的准确性。
-
公开(公告)号:CN117671721A
公开(公告)日:2024-03-08
申请号:CN202210998576.6
申请日:2022-08-19
Applicant: 富士通株式会社
IPC: G06V40/10 , G06V40/20 , G06V10/25 , G06V10/44 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本申请实施例提供一种动作识别装置和方法以及电子设备。所述方法包括:在对象的骨骼图中,根据所述骨骼图中的关键点以及关键点层级,确定搜索的起始关键点;根据以所述起始关键点为中心的感兴趣区域内的部分亲和字段,确定搜索方向;沿着所述搜索方向确定搜索终点;在所述搜索终点周围的感兴趣区域内,选择置信图峰值最大的位置作为缺失的关键点的位置;将所述缺失的关键点补入所述骨骼图,以生成所述对象的修正骨骼图;以及根据所述修正骨骼图进行所述对象的动作识别。由此,能够提高动作识别结果的准确性。
-
公开(公告)号:CN117238023A
公开(公告)日:2023-12-15
申请号:CN202210628414.3
申请日:2022-06-06
Applicant: 富士通株式会社
Inventor: 蔡文婷
Abstract: 本申请实施例提供一种动作识别装置和方法以及电子设备。所述方法包括:使用神经网络获得视频帧中的对象的关键点信息和部分亲和字段信息;根据所述关键点信息、所述部分亲和字段信息以及相邻的两个关键点之间的距离计算与所述相邻的两个关键点对应的部分亲和字段分数,所述部分亲和字段分数与所述相邻的两个关键点之间的距离负相关;根据所述关键点信息和所述部分亲和字段分数进行关键点连接,以生成多个关键点连接候选;根据所述关键点候选确定所述对象的骨骼图;以及根据所述骨骼图进行所述对象的动作识别。由此,能够提高自下而上的方案中动作识别结果的准确性。
-
公开(公告)号:CN112019841A
公开(公告)日:2020-12-01
申请号:CN201910470686.3
申请日:2019-05-31
Applicant: 富士通株式会社
IPC: H04N19/103 , H04N19/176 , H04N19/70
Abstract: 本发明实施例提供一种视频编码方法及装置、电子设备。首先写入最可能模式标记的值并根据该值确定是否写入帧内亮度多参考行索引和帧内子块划分模式标记中的至少一个的值,因此,当最可能模式标记的值为0时,默认帧内亮度多参考行索引和帧内子块划分模式标记的值均为0,即不需要再显式的写入帧内亮度多参考行索引和帧内子块划分模式标记的值,从而简化了编码的语法规范,并减少了编码过程中的比特开销,提高了编码速度和编码效率。
-
公开(公告)号:CN117671720A
公开(公告)日:2024-03-08
申请号:CN202210998550.1
申请日:2022-08-19
Applicant: 富士通株式会社
Abstract: 本申请实施例提供一种动作识别装置、方法以及电子设备。所述方法包括:使用第一神经网络对视频帧进行处理,输出部分亲和字段和置信图;通过第二神经网络对所述视频帧中的对象进行检测,输出所述对象的边界框;以及根据所述部分亲和字段、所述置信图和所述边界框进行所述对象的动作识别。由此,能够提高动作识别结果的准确性。
-
-
-
-
-