-
公开(公告)号:CN114902294B
公开(公告)日:2023-10-20
申请号:CN202080091681.0
申请日:2020-12-23
Applicant: 国际商业机器公司
IPC: G06V20/20 , G06V20/64 , G06V10/25 , G06V10/774 , G06V10/764 , G06V10/82 , H04B1/3827 , G06N3/0464 , G06N3/08
Abstract: 获得对对象的三维点云表示的访问,三维点云表示包括扫描数字相机的位姿和对应的视频帧。对三维点云表示进行下采样以获得感兴趣区域候选的集合。过滤感兴趣区域候选以至少部分基于相机的位姿来选择感兴趣区域候选中具有区分不同视觉状态的外观改变的那些感兴趣区域候选作为所选择的感兴趣区域。从视频帧中的对应视频帧生成针对所选择的感兴趣区域的感兴趣区域图像;以及基于感兴趣区域图像来训练深度学习识别模型。被训练的深度学习识别模型可以用于例如确定对象的视觉状态以用于修复指令。
-
公开(公告)号:CN114902294A
公开(公告)日:2022-08-12
申请号:CN202080091681.0
申请日:2020-12-23
Applicant: 国际商业机器公司
IPC: G06V20/20 , G06V20/64 , G06V10/25 , G06V10/774 , G06V10/764 , G06V10/82 , H04B1/3827 , G06N3/04 , G06N3/08
Abstract: 获得对对象的三维点云表示的访问,三维点云表示包括扫描数字相机的位姿和对应的视频帧。对三维点云表示进行下采样以获得感兴趣区域候选的集合。过滤感兴趣区域候选以至少部分基于相机的位姿来选择感兴趣区域候选中具有区分不同视觉状态的外观改变的那些感兴趣区域候选作为所选择的感兴趣区域。从视频帧中的对应视频帧生成针对所选择的感兴趣区域的感兴趣区域图像;以及基于感兴趣区域图像来训练深度学习识别模型。被训练的深度学习识别模型可以用于例如确定对象的视觉状态以用于修复指令。
-