一种基于注意力机制的轻量化人脸追踪方法及系统

    公开(公告)号:CN118366205A

    公开(公告)日:2024-07-19

    申请号:CN202410777240.6

    申请日:2024-06-17

    Abstract: 本发明涉及一种基于注意力机制的轻量化人脸追踪方法及系统,方法包括:构建预设人脸检测YOLO‑Face模型;使用GSConv对原始特征提取网络进行改进,得到改进特征提取网络;将ASFF网络结构与原始特征融合网络结合,得到改进特征融合网络;将SimAM机制加入原始特征输出网络的检测头中,得到改进特征输出网络;构建得到轻量化人脸追踪模型;通过人脸追踪数据训练集对轻量化人脸追踪模型进行优化训练,得到最优人脸追踪模型;当接收到待追踪图像时,通过最优人脸追踪模型输出人脸追踪结果。通过注意力机制改进轻量化的YOLO‑Face模型,优化了模型结构的同时并通过增加较少的计算量,从而换取人脸追踪效果的提升。

    基于注意力机制改进YOLOv5的人脸检测方法及系统

    公开(公告)号:CN118366204A

    公开(公告)日:2024-07-19

    申请号:CN202410776303.6

    申请日:2024-06-17

    Abstract: 本发明涉及基于注意力机制改进YOLOv5的人脸检测方法及系统,方法包括:构建预设人脸检测YOLOv5Face模型;使用注意力机制对原始特征提取网络进行改进,得到改进特征提取网络;构建得到改进人脸检测YOLOv5Face模型;获取人脸检测数据训练集;通过人脸检测数据训练集对改进人脸检测YOLOv5Face模型进行优化训练,得到最优人脸检测YOLOv5Face模型;当接收到待检测图像时,通过最优人脸检测YOLOv5Face模型对待检测图像进行处理,输出人脸检测结果。通过注意力机制改进YOLOv5Face模型,优化了模型结构的同时并通过增加较少的计算量,从而换取人脸检测效果的提升。

    一种语音驱动目标人视频生成方法、装置及存储介质

    公开(公告)号:CN114202604A

    公开(公告)日:2022-03-18

    申请号:CN202111466434.7

    申请日:2021-11-30

    Abstract: 本发明公开了一种语音驱动目标人视频生成方法、装置及存储介质,其中方法包括:获取语音数据和人物上半身正面图像;基于获取的人物上半身正面图像提取初始头部关键点坐标矩阵和初始上半身关键点坐标矩阵;基于获取的语音数据分离语音内容信息和音频信息;基于语音内容信息、音频信息、初始头部关键点坐标矩阵以及初始上半身关键点坐标矩阵,训练语音内容信息、音频信息与头部关键点坐标及上半身关键点坐标之间的多维映射关系;基于多维映射关系生成得到视频图像帧序列;将视频图像帧序列与语言数据进行拼接,得到目标人语音视频。充分考虑了头部动作和上半身的联动,生成的视频自然,真实感强。

Patent Agency Ranking