-
公开(公告)号:CN116958554A
公开(公告)日:2023-10-27
申请号:CN202310959223.X
申请日:2023-08-01
Applicant: 长江时代通信股份有限公司 , 哈尔滨工业大学(威海)
IPC: G06V10/26 , G06V10/82 , G06V20/70 , G06N3/0455 , G06N3/0464 , G06N3/048 , G06N3/084 , G06N3/0895
Abstract: 本发明公开一种基于潜在扩散模型和多级上下文交叉一致性的半监督分割方法,该方法包括两个阶段,图像生成阶段和半监督学习阶段。在图像生成阶段包括如下步骤:首先将图像输入到变分自动编码器的编码器中生成潜在空间编码,将对应图像的潜在空间编码输入到潜在扩散模型中,其次利用去噪自动编码器对加噪后的潜在空间编码计算去噪拟合损失以学习去噪分布,最后利用潜在扩散模型随机生成高斯噪声并进行去噪估计以生成潜在空间编码,将潜在空间编码通过变分自动解码器生成像素级图像。为了利用图像生成阶段生成的大量有价值合成无标记样本,半监督学习阶段包括如下步骤:首先将有标记图像和无标记合成图像样本输入到编码器以提取高级语义特征,其次引入多个辅助解码器,对辅助解码器和主解码器的输入特征提取不同等级的全局上下文信息,并对辅助解码器的输入特征额外施加噪声扰动,最后通过保持主解码器和辅助解码器之间输出结果的一致性来学习生成的未标记样本。发明可以用于任何利用合成图像进行半监督学习的任务。
-
公开(公告)号:CN116402996A
公开(公告)日:2023-07-07
申请号:CN202310289173.9
申请日:2023-03-20
Applicant: 哈尔滨工业大学(威海) , 长江时代通信股份有限公司
IPC: G06V10/26 , G06V10/44 , G06V10/42 , G06V10/82 , G06N3/045 , G06N3/0455 , G06N3/048 , G06N3/0464 , G06N3/084
Abstract: 本申请公开了一种图像分割方法、装置、存储介质及电子装置。该方法包括接收待分割图像;采用第一编码器对所述待分割图像进行多级编码,得到多级语义特征;采用第二编码器对高级语义特征图进行混合编码,得到全局上下文特征;采用解码器基于多尺度注意力门,构建全局上下文特征和多级语义特征的跳跃连接;对跳跃连接后的特征进行重建以细粒度地实现图像分割。在使用较少数据集和算力的情况下获取全局上下文,且抑制输入图像中于分割目标无关的区域,同时突出对分割目标有用的显著特征,能够有效提升分割性能。本申请解决了由于需要大量数据集和算力以获取全局上下文,且跳跃连接时无法传递有价值的显著特征造成的分割性能差的技术问题。
-
公开(公告)号:CN114783072B
公开(公告)日:2022-12-30
申请号:CN202210266952.2
申请日:2022-03-17
Applicant: 哈尔滨工业大学(威海) , 南京龙垣信息科技有限公司
IPC: G06V40/70 , G06V10/40 , G06V10/774 , G06V10/764 , G06V10/80
Abstract: 本发明公开一种基于远域迁移学习的图像识别方法,包括如下步骤:将医学领域的小样本图像作为目标域,同时将与目标域相似度高的无标签图像作为辅助域,将自然场景图像作为源域,通过基于Resnet50的轻量级网络提取各自域的高级语义特征;利用具有域距离度量的卷积自动编码器并通过辅助域作为桥梁对源域和目标域的高级语义特征进行特征融合;通过卷积自动解码器重构各自域的高级语义特征;最后通过全连接层对目标域图像进行识别,整个过程通过多任务损失函数进行优化。本发明改善了模型对高级语义信息的提取能力和稳定性,有效提升了模型远域特征迁移能力,本发明可以用于不同任务的图像识别任务。
-
公开(公告)号:CN114783072A
公开(公告)日:2022-07-22
申请号:CN202210266952.2
申请日:2022-03-17
Applicant: 哈尔滨工业大学(威海) , 南京龙垣信息科技有限公司
IPC: G06V40/70 , G06V10/40 , G06V10/774 , G06V10/764 , G06V10/80 , G06K9/62
Abstract: 本发明公开一种基于远域迁移学习的图像识别方法,包括如下步骤:将特定领域的小样本图像作为目标域,同时将与目标域相似度高的无标签图像作为辅助域,将自然场景图像作为源域,通过基于ResNet50的轻量级网络提取各自域的高级语义特征;利用具有域距离度量的卷积自动编码器并通过辅助域作为桥梁对源域和目标域的高级语义特征进行特征融合;通过卷积自动解码器重构各自域的高级语义特征;最后通过全连接层对目标域图像进行识别,整个过程通过多任务损失函数进行优化。本发明改善了模型对高级语义信息的提取能力和稳定性,有效提升了模型远域特征迁移能力,本发明可以用于不同任务的图像识别任务。
-
-
-