一种多模态深度感知的高精度集成动态手势识别方法

    公开(公告)号:CN118155290A

    公开(公告)日:2024-06-07

    申请号:CN202410442762.0

    申请日:2024-04-12

    Abstract: 本发明公开了一种多模态深度感知的高精度集成动态手势识别方法。首先获取动态手势数据集,应用2D和3D数据增强方法增加样本数量;然后将增强后的数据进行灰度变换,并分别输入3D‑CNN子网络、ConvLSTM子网络和TCN子网络分别提取手势序列特征;将手势序列特征直接或融合输入相应分类器;最后将分类器结果集成,输出最终的概率分布。本发明额外对数据进行了数据增强和灰度变换,在数据原有的多模态之外,增加了灰度2D和灰度3D模态,使得本方法能识别分辨率更低的输入图像;并且本发明使用了一种优化加权集成,能够更有效地优化的综合多模态的分类结果。

    基于强化学习的场景布局估计方法

    公开(公告)号:CN118865392A

    公开(公告)日:2024-10-29

    申请号:CN202411339837.9

    申请日:2024-09-25

    Abstract: 本发明公开了基于强化学习的场景布局估计方法,涉及场景布局估计技术领域,包括如下步骤:将场景的稠密点云映射到平面上,利用形态学侵蚀进行分割,并进行合并处理,得到房间点云;再将房间点云投影到二维平面上,提取房间点云中的边缘点云,并进行分割处理,得到独立区域的壁面点云;然后基于Q‑learning算法,确定强化学习中的状态、动作和奖励;再基于独立区域的壁面点云采用Q‑learning算法拟合线段,得到独立区域的壁面线段数据;最后基于独立区域的壁面线段数据,生成场景布局模型;本发明用于解决现有技术中无法在消除了独立区域之间的干扰和遮挡物的影响的同时减少计算量,场景布局估计效率和准确性较低的问题。

Patent Agency Ranking