-
公开(公告)号:CN117727071A
公开(公告)日:2024-03-19
申请号:CN202311840269.6
申请日:2023-12-28
Applicant: 重庆邮电大学 , 重庆市科学技术研究院
IPC: G06V40/10 , G06V10/34 , G06V10/42 , G06V10/44 , G06V10/80 , G06V10/82 , G06T7/73 , G06T7/66 , G06N3/0455 , G06N3/0464 , G06N3/09 , G06N3/096
Abstract: 本发明属于自然图像领域,具体涉及一种基于分步处理关节的文本引导多人姿态估计方法,包括构建姿态估计网络并对其进行训练,将待检测的任务场景图输入完成训练的姿态估计网络得到的热图经过非极大值抑制进行后处理得到图像中每个人物的关节点坐标,将目标任人物的关节点和骨架连接输出作为姿态估计;本发明采用针对关节的分而治之和文本提示策略,能够有效地解决场景复杂和遮挡严重以及场景姿态数据集稀少的问题。
-
公开(公告)号:CN119445619A
公开(公告)日:2025-02-14
申请号:CN202411566435.2
申请日:2024-11-05
Applicant: 重庆邮电大学
IPC: G06V40/10 , G06V10/774 , G06V10/80 , G06V10/82 , G06T7/73 , G06N3/0455 , G06N3/0464 , G06N3/0895
Abstract: 本发明属于计算机视觉领域,具体涉及一种基于视觉Transformer的头部姿态估计方法,包括:构建头部姿态估计模型;获取待检测的图像,将图像输入到训练后的头部姿态估计模型中,得到头部姿态估计结果;所述头部姿态估计模型包括视觉Transformer预训练网络模块、多尺度Transformer编码器模块、CNN模块以及预测头模块;本发明通过图像翻折操作引入翻折图像,能够为原图像提供自监督信息,通过这种方式,模型可以学习到姿态变化的反向特征,使得模型能够捕捉到不同姿态下的相似性,进一步提升头部姿态估计的准确度和稳定性。
-
公开(公告)号:CN117711064A
公开(公告)日:2024-03-15
申请号:CN202311718879.9
申请日:2023-12-13
Applicant: 重庆邮电大学
IPC: G06V40/20 , G06V10/40 , G06V10/774 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明属于图像处理领域,尤其涉及基于知识蒸馏的跨域人体行为识别方法,包括:构建基于知识蒸馏的跨域人体行为识别模型,获取待识别的雷达微多普勒图像,经预处理输入训练好的基于知识蒸馏的跨域人体行为识别模型,输出雷达微多普勒图像人体行为识别结果。模型的训练过程主要包括:获取训练样本,按顺序分别经过数据生成模块、特征提取模块、分类模块和知识蒸馏模块的处理,计算得到分类损失、跨域相关性损失和域内一致性损失,按照比例加权求和,计算得到模型的总体损失函数,迭代训练,直至总体损失函数收敛或达到预设条件时停止训练。采用本发明的方法可以有效解决因域间差异造成的模型泛化能力差的问题,提高分类精度和识别准确性。
-
-