-
公开(公告)号:CN118521930A
公开(公告)日:2024-08-20
申请号:CN202310184577.1
申请日:2023-02-20
Applicant: 杭州海康威视数字技术股份有限公司 , 浙江大学
Abstract: 本发明公开了一种基于人机混合智能的视频像素级标注方法、装置。其步骤如下:1)使用交互式像素标注工具对视频帧进行稀疏的人工标注;2)使用基于像素匹配的卷积神经网络对稀疏标注的实例物体进行自动追踪匹配;3)利用时序变换神经网络自动将稀疏的视频帧像素标注扩展为密集标注;4)进行半自动低质量标注帧检测;人工修复该帧后作为时序变换神经网络的输入,进一步提升密集标注质量,多轮次迭代后达到用户满意的标注精度。本发明适用于大规模视频的像素级语义与实例标注,大幅度提升视频数据标注效率,且准确性好、标注质量高。本发明对于大规模视频数据标注和分析具有十分重要的实际应用价值。
-
公开(公告)号:CN120071055A
公开(公告)日:2025-05-30
申请号:CN202510546309.9
申请日:2025-04-28
Applicant: 浙江大学
IPC: G06V10/776 , G06V10/74 , G06V10/82 , G06T7/00 , G06T11/00
Abstract: 本发明公开了一种基于多模态大模型的文本到图像生成模型评估方法与系统。本发明包括多层次图像信息提取与图像特征矩阵构建、分层文本提示生成与优化、生成图像批量化生成、交互式图像对比与评分、多维反馈与提示修订多个步骤,通过重复执行这些步骤流程动态调整生成策略,直至满足预设停止条件。最终,根据参考图像与最优生成图像的多维视觉评估结果,全面分析目标生成模型的性能表现。本发明的评估方法通过图像再生成任务,使生成模型能够基于参考图像的内容和风格进行精准生成,克服了现有评估方法在跨模态信息对齐方面的不足,具有较高的应用价值。
-
公开(公告)号:CN120046048A
公开(公告)日:2025-05-27
申请号:CN202510536167.8
申请日:2025-04-27
Applicant: 浙江大学
IPC: G06F18/2415 , G06F18/214 , G06F21/62
Abstract: 本发明公开了一种基于个性化联邦学习的扩散模型训练与采样方法及系统。本发明在每个客户端上利用本地数据和个性化嵌入层进行扩散模型的训练,但仅训练扩散模型去噪过程的后半部分时间步骤,以限制模型的全局去噪能力,同时由个性化嵌入层作为隐私保护机制,确保模型仅生成符合本地数据分布的图像,同时防止其他客户端获得本地数据的数据分布;模型在本地训练若干轮后,保留个性化嵌入层在客户端本地,其余参数上传至服务器;服务器对接收到的模型参数进行加权聚合,并将更新后的全局模型参数发送回各客户端,客户端接收全局模型并于本地个性化嵌入层相结合进一步优化本地模型。本发明可以显著提升图像生成质量,同时有效降低了隐私泄露风险。
-
公开(公告)号:CN117409270A
公开(公告)日:2024-01-16
申请号:CN202311346073.1
申请日:2023-10-17
Applicant: 浙江大学
IPC: G06V10/774 , G06V10/22 , G06V10/26 , G06V10/764 , G06V10/82 , G06V20/70 , G06F21/62 , G06N3/0455 , G06N3/084 , G06N3/0895 , G06N3/098
Abstract: 本发明公开了一种基于联邦学习的多方隐私数据联合像素级标注方法及系统。各用户首先使用交互式语义分割大模型,在本地私有的图像数据中进行像素级标注;然后每个客户端使用本地标注数据训练本地模型,通过修正的交叉熵损失函数,纠正本地模型更新过程中的本地类别漂移问题;当本地模型训练若干轮后,每个客户端将其本地模型发送到中心服务器进行聚合,使全局模型拥有预测全部类别能力;聚合完成后,中心服务器将全局模型的更新发送回每个客户端来改进本地模型,并进一步通过像素级对比学习损失函数,将各个语义类别在编码空间中区分,扩大本地模型的标注类别。本发明的方法能够显著降低数据标注成本,并利用联邦学习范式确保了数据隐私的安全。
-
-
-