一种基于交叉分辨率知识蒸馏的连续手语识别方法

    公开(公告)号:CN116580451A

    公开(公告)日:2023-08-11

    申请号:CN202310434423.3

    申请日:2023-04-21

    Abstract: 本发明公开了一种基于交叉分辨率知识蒸馏的连续手语识别方法,包括以下步骤:S1:对输入的连续手语视频数据进行预处理;S2:将高分辨率连续手语视频输入到教师网络多尺度时序特征网络MSTNet进行训练;S3:搭建学生网络低分辨率输入网络LRINet;S4:将高分辨率连续手语视频输入到锁定权值的MSTNet网络,将低分辨率连续手语视频输入到LRINet网络,采用混合损失函数对LRINet网络进行训练;S5:锁定LRINet网络权值,使用此网络对低分辨率连续手语视频进行识别。本发明提供的基于交叉分辨率知识蒸馏的连续手语识别方法,能够以低分辨率连续手语视频作为输入,在保证识别精度的同时降低了模型的参数量、计算量和推理时间,达到了性能和精度的平衡。

Patent Agency Ranking