一种基于双路径刺激的连续手语识别方法

    公开(公告)号:CN117373129A

    公开(公告)日:2024-01-09

    申请号:CN202311375163.3

    申请日:2023-10-23

    Abstract: 本发明属于连续手语识别领域,公开了一种基于双路径刺激的连续手语识别方法,包括:获取待识别的手语视频,解析手语视频将视频帧序列输入特征提取器;特征提取器通过主干网络输出视觉特征,主干网络中插入有一个或多个双路径刺激,所述双路径刺激包括全局解释刺激和局部波动刺激两条刺激路径,视频帧序列分别输入全局解释刺激和局部波动刺激,并综合全局解释刺激和局部波动刺激的输出后得到双路径刺激的输出;将得到的视觉特征输入对齐模块,所述对齐模块通过双向长短期记忆网络和分类器输出连续手语识别预测结果。本发明有效提高连续手语识别效果,降低计算成本。

    一种基于姿态先验约束的启发式三维人体网格重建方法

    公开(公告)号:CN117372651A

    公开(公告)日:2024-01-09

    申请号:CN202311449598.8

    申请日:2023-11-02

    Abstract: 本发明属于单目三维人体重建技术领域,公开了一种基于姿态先验约束的启发式三维人体网格重建方法,本发明从特征图中提取综合先验约束向量,它将自我注意力集中在图像中人体的身体部分,避免了特征冗余。另外将骨架信息合并到一个互逆映射层中,增强模型修正人体网格姿态能力的同时保证了输入输出的语义一致性。此外,本发明提取的区域先验约束通过将交叉注意力指向顶点周围的关键点来微调局部顶点。然后,在微调过程中,利用启发式微调策略确定当前查询顶点的最优偏移量。和传统基于Transformer的方法相比,本发明所提出的启发式Transformer有效地减少了交叉注意力查询数量,在保证模型轻量级的同时加速模型的收敛速度。

Patent Agency Ranking