一种基于视频图像智能理解的手术阶段识别方法及装置

    公开(公告)号:CN119206559A

    公开(公告)日:2024-12-27

    申请号:CN202411044333.4

    申请日:2024-07-31

    Abstract: 本发明涉及计算机视觉技术领域,特别是指一种基于视频图像智能理解的手术阶段识别方法及装置。所述方法包括:使用每个视频帧的图片信息以及标签信息,对AVT网络进行训练,获得训练后AVT网络;基于训练后AVT网络,对视频帧信息进行特征提取,获得每个视频帧的空间特征;基于局部时间特征聚合器,根据每个视频帧的空间特征,通过head模块进行手术阶段预测,获得逐帧手术阶段预测结果;基于分类网络,根据每个视频帧的空间特征构建手术阶段的多个时间提案;根据多个时间提案,对逐帧手术阶段预测结果进行修正,获得最终手术阶段预测结果。本发明是一种阶段内预测一致性强且准确度高的手术阶段识别方法。

Patent Agency Ranking