-
公开(公告)号:CN119206559A
公开(公告)日:2024-12-27
申请号:CN202411044333.4
申请日:2024-07-31
Applicant: 北京科技大学
IPC: G06V20/40 , G06V10/44 , G06V10/52 , G06V10/62 , G06V10/764 , G06V10/80 , G06V10/82 , G06T7/00 , G06N3/0455 , G06N3/0464
Abstract: 本发明涉及计算机视觉技术领域,特别是指一种基于视频图像智能理解的手术阶段识别方法及装置。所述方法包括:使用每个视频帧的图片信息以及标签信息,对AVT网络进行训练,获得训练后AVT网络;基于训练后AVT网络,对视频帧信息进行特征提取,获得每个视频帧的空间特征;基于局部时间特征聚合器,根据每个视频帧的空间特征,通过head模块进行手术阶段预测,获得逐帧手术阶段预测结果;基于分类网络,根据每个视频帧的空间特征构建手术阶段的多个时间提案;根据多个时间提案,对逐帧手术阶段预测结果进行修正,获得最终手术阶段预测结果。本发明是一种阶段内预测一致性强且准确度高的手术阶段识别方法。