-
公开(公告)号:CN118350984A
公开(公告)日:2024-07-16
申请号:CN202410608320.9
申请日:2024-05-16
Applicant: 哈尔滨工业大学(威海) , 长江时代通信股份有限公司
IPC: G06T3/04 , G06N3/0455
Abstract: 本发明公开了一种基于多层次级联结构的图像风格迁移方法,步骤包括:将风格图和内容图输入到级联编码器中得到不同尺度的风格语义特征以及内容语义特征;对风格语义特征以及内容语义特征的每一尺度使用协方差变换网络进行特征融合,生成融合特征图;对融合特征图计算多级风格损失;对多级风格损失计算后的融合特征图计算多级内容损失;对计算损失后的融合特征图进行解码操作并作为下一级特征融合的内容图,经过级联的编解码器结构最终生成多层次风格迁移后的风格化图像。该图像风格迁移方法能够有效提升模型在不同风格特征迁移情况下对风格图的特征捕捉和迁移能力。
-
公开(公告)号:CN118015282B
公开(公告)日:2024-11-05
申请号:CN202410311121.1
申请日:2024-03-19
Applicant: 哈尔滨工业大学(威海) , 南京龙垣信息科技有限公司
IPC: G06V10/26 , G06V20/70 , G06T7/194 , G06V10/44 , G06V10/52 , G06V10/80 , G06V10/764 , G06V10/762 , G06V10/82 , G06N3/0464 , G06N3/084 , G06N3/0895 , G06N3/048
Abstract: 本发明涉及数据处理技术领域,具体涉及一种基于背景先验的弱监督语义分割方法,包括:将仅带有图像级标签的特定数据集输入背景聚类算法中根据像素值进行背景聚类,得到聚类掩码图;将数据集输入到在自然图像上经过预训练的SAM模型中进行推理,得到预训练掩码图;通过分割结果融合模块将聚类掩码图和预训练掩码图进行基于IOU的掩码融合,生成背景掩码图;利用多个串行的多尺度拼接卷积块,实现数据集特征的塔式提取,生成分类特征图;将背景掩码图对分类特征图中的前景和背景进行区分;将前景输入到分类器进行分类操作,并进行视觉可视化;本发明解决了现有的语义分割技术中分割标签难以获得和弱监督分割效果不佳的问题。
-
公开(公告)号:CN118015282A
公开(公告)日:2024-05-10
申请号:CN202410311121.1
申请日:2024-03-19
Applicant: 哈尔滨工业大学(威海) , 南京龙垣信息科技有限公司
IPC: G06V10/26 , G06V20/70 , G06T7/194 , G06V10/44 , G06V10/52 , G06V10/80 , G06V10/764 , G06V10/762 , G06V10/82 , G06N3/0464 , G06N3/084 , G06N3/0895 , G06N3/048
Abstract: 本发明涉及数据处理技术领域,具体涉及一种基于背景先验的弱监督语义分割方法,包括:将仅带有图像级标签的特定数据集输入背景聚类算法中根据像素值进行背景聚类,得到聚类掩码图;将数据集输入到在自然图像上经过预训练的SAM模型中进行推理,得到预训练掩码图;通过分割结果融合模块将聚类掩码图和预训练掩码图进行基于IOU的掩码融合,生成背景掩码图;利用多个串行的多尺度拼接卷积块,实现数据集特征的塔式提取,生成分类特征图;将背景掩码图对分类特征图中的前景和背景进行区分;将前景输入到分类器进行分类操作,并进行视觉可视化;本发明解决了现有的语义分割技术中分割标签难以获得和弱监督分割效果不佳的问题。
-
公开(公告)号:CN119206568A
公开(公告)日:2024-12-27
申请号:CN202411238187.9
申请日:2024-09-05
Applicant: 哈尔滨工业大学(威海) , 南京龙垣信息科技有限公司
IPC: G06V20/40 , G06V10/26 , G06V10/82 , G06V10/80 , G06V10/44 , G06V10/52 , G06N3/0464 , G06N3/0455
Abstract: 本发明涉及深度学习语义分割技术领域,尤其涉及一种基于选择性扫描视觉状态空间模型的视频序列分割方法,将图像序列输入到重叠特征块划分层,将输入图像序列划分为图像特征块序列;将图像特征块序列输入到基于选择性扫描视觉的状态空间模型编码器中提取不同尺度上的粗细特征序列;将不同尺度上的粗细特征序列输入到多层感知机层进行多级特征的有效融合得到特征序列;将特征序列输入到基于卷积神经网络的轻量级解码头预测分割掩码,并进行视觉可视化生成语义分割图;以此方式解决了现有技术中传统的卷积神经网络接受范围有限,并且基于自注意力的网络在构建长期依赖方面具有极高的计算复杂度,从而导致图像序列分割效果差的技术问题。
-
-
-