-
公开(公告)号:CN119580025A
公开(公告)日:2025-03-07
申请号:CN202311160188.1
申请日:2023-09-07
Applicant: 富士通株式会社
IPC: G06V10/774 , G06V10/40 , G06V10/764 , G06V10/80 , G06V40/20 , G06F16/53
Abstract: 本公开内容涉及用于训练检测人‑物品交互的模型的方法、检测人‑物品交互的装置及存储介质。根据一个实施例,该用于训练检测人‑物品交互的模型的方法包括:从样本图像中提取视觉特征;基于视觉特征确定物品的预测位置、物品的预测分类及人员对物品执行的动作的预测动作分类,并生成第一查询向量;基于第一查询向量和视觉特征,确定人员的与物品接触的局部身体的预测位置,并生成第二查询向量;通过融合第一查询向量和第二查询向量生成第三查询向量;基于视觉特征和第三查询向量确定人员的预测位置;以及基于预测结果调整模型的参数。
-
公开(公告)号:CN118053012A
公开(公告)日:2024-05-17
申请号:CN202211460259.5
申请日:2022-11-17
Applicant: 富士通株式会社
IPC: G06V10/764 , G06V10/774
Abstract: 本申请公开一种信息处理装置、信息处理方法和计算机可读记录介质。该信息处理装置包括:模型建立单元,被配置成对基于级联分离网络的第一模型添加对象部分解码器,以建立包括对象部分解码器的第一模型作为第二模型;以及模型训练单元,被配置成基于损失函数,利用训练图像集对第二模型进行训练,以获得用于对待预测图像进行预测的经训练的第二模型。对象部分解码器用于预测预定对象的预定部分的位置。损失函数包括针对预定对象的预定部分的位置的第一损失函数。第二模型中的交互解码器的输入查询向量是基于第二模型中的对象对解码器的输出向量和对象部分解码器的输出向量两者的。
-