-
公开(公告)号:CN117789080A
公开(公告)日:2024-03-29
申请号:CN202311772954.X
申请日:2023-12-21
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06V20/40 , G06V10/82 , G06V10/26 , G06N3/0455 , G06N3/08
Abstract: 本申请提供了一种指向性视频对象分割方法,包括基于短视频数据进行文本标注制作数据集;用所述数据集训练神经网络分割模型,所述神经网络分割模型包括时间编码器、空间编码器、解码器,在所述空间编码器和所述时间编码器的第s级后插入所述LBDT模块,所述LBDT模块的结果输入到所述解码器;将待预测视频数据输入到训练好的所述神经网络分割模型,得到对象分割结果。首创基于短视频制作数据集,并添加中文标注训练得到的包含改进LBDT模块的神经网络分割模型。可以至少用以解决现有指向性视频对象分割方法在特定语种下准确度不够高的技术问题。