一种基于视觉Transformer的头部姿态估计方法

    公开(公告)号:CN119445619A

    公开(公告)日:2025-02-14

    申请号:CN202411566435.2

    申请日:2024-11-05

    Abstract: 本发明属于计算机视觉领域,具体涉及一种基于视觉Transformer的头部姿态估计方法,包括:构建头部姿态估计模型;获取待检测的图像,将图像输入到训练后的头部姿态估计模型中,得到头部姿态估计结果;所述头部姿态估计模型包括视觉Transformer预训练网络模块、多尺度Transformer编码器模块、CNN模块以及预测头模块;本发明通过图像翻折操作引入翻折图像,能够为原图像提供自监督信息,通过这种方式,模型可以学习到姿态变化的反向特征,使得模型能够捕捉到不同姿态下的相似性,进一步提升头部姿态估计的准确度和稳定性。

    基于知识蒸馏的跨域人体行为识别方法

    公开(公告)号:CN117711064A

    公开(公告)日:2024-03-15

    申请号:CN202311718879.9

    申请日:2023-12-13

    Abstract: 本发明属于图像处理领域,尤其涉及基于知识蒸馏的跨域人体行为识别方法,包括:构建基于知识蒸馏的跨域人体行为识别模型,获取待识别的雷达微多普勒图像,经预处理输入训练好的基于知识蒸馏的跨域人体行为识别模型,输出雷达微多普勒图像人体行为识别结果。模型的训练过程主要包括:获取训练样本,按顺序分别经过数据生成模块、特征提取模块、分类模块和知识蒸馏模块的处理,计算得到分类损失、跨域相关性损失和域内一致性损失,按照比例加权求和,计算得到模型的总体损失函数,迭代训练,直至总体损失函数收敛或达到预设条件时停止训练。采用本发明的方法可以有效解决因域间差异造成的模型泛化能力差的问题,提高分类精度和识别准确性。

Patent Agency Ranking