-
公开(公告)号:CN118194099B
公开(公告)日:2024-08-13
申请号:CN202410612617.2
申请日:2024-05-17
Applicant: 浙江大学
IPC: G06F18/24 , G06N3/088 , G06N3/0895 , G06F18/23213 , G06N3/045 , G06N3/0442
Abstract: 本发明公开了一种用于无监督动作检测的方法、系统、介质及设备,属于计算机视觉领域。本发明首先通过无监督的训练方式训练一个可以抽取动作语义的骨架编码器;然后在少量有标签骨架序列上训练线性分类器,利用训练好的骨架编码器和线性分类器即可得到一个优异的动作检测系统。本发明设计了一个迭代训练过程来确保无监督训练的骨架编码器可以获取更准确的语义信息,主要包括两个阶段:1)对比学习:输入骨架序列,正样本通过数据增强生成,负样本来自记忆库;2)语义聚类:对所有骨架序列编码,然后通过聚类来挖掘动作语义信息,输出当前的语义编码本,优化下一轮的对比学习阶段。本发明可以在无需大量标注数据的情况下完成异常行为检测。
-
公开(公告)号:CN120032163A
公开(公告)日:2025-05-23
申请号:CN202411989922.X
申请日:2024-12-31
Applicant: 浙江大学
IPC: G06V10/764 , G06V10/774 , G06V10/26 , G06V10/44 , G06V10/82 , G06V20/58
Abstract: 本发明公开了一种生成图像正样本实现图像分类的方法、系统、介质及设备,属于计算机视觉领域。本发明首先通过多模态模型提取并重写文本语义,增强视觉提示,进而引导去噪扩散模型生成与原始图像语义一致的正样本,并利用对比学习对图像编码器进行无监督训练,使其准确获取语义信息;使用有标签的特征向量训练线性分类器,从而构建出图像分类模型,用于图像分类任务,最终可以在无需大量标注数据的情况下完成图像类别判断。
-
公开(公告)号:CN118194099A
公开(公告)日:2024-06-14
申请号:CN202410612617.2
申请日:2024-05-17
Applicant: 浙江大学
IPC: G06F18/24 , G06N3/088 , G06N3/0895 , G06F18/23213 , G06N3/045 , G06N3/0442
Abstract: 本发明公开了一种用于无监督动作检测的方法、系统、介质及设备,属于计算机视觉领域。本发明首先通过无监督的训练方式训练一个可以抽取动作语义的骨架编码器;然后在少量有标签骨架序列上训练线性分类器,利用训练好的骨架编码器和线性分类器即可得到一个优异的动作检测系统。本发明设计了一个迭代训练过程来确保无监督训练的骨架编码器可以获取更准确的语义信息,主要包括两个阶段:1)对比学习:输入骨架序列,正样本通过数据增强生成,负样本来自记忆库;2)语义聚类:对所有骨架序列编码,然后通过聚类来挖掘动作语义信息,输出当前的语义编码本,优化下一轮的对比学习阶段。本发明可以在无需大量标注数据的情况下完成异常行为检测。
-
-