-
公开(公告)号:CN118736575A
公开(公告)日:2024-10-01
申请号:CN202410807697.7
申请日:2024-06-21
Applicant: 中国矿业大学
IPC: G06V20/70 , G06V10/80 , G06V10/82 , G06V10/44 , G06N3/0455 , G06N3/045 , G06N3/0499 , G06N3/0464 , G06N3/084
Abstract: 本发明提出一种基于增强注意力机制的端到端图像描述生成方法,属于人工智能技术领域。生成图像描述生成模型,包括图像特征抽取层、多粒度特征融合编码器、自适应双向解图码器、线性变换层和打分排序层;对图像描述生成模型使用交叉熵损失进行训练,然后采用自我批评训练优化CIDEr评分优化,并利用完成训练的图像描述生成模型描述图像。其评价指标上超越了现有技术,本发明的图像描述方法不仅提高了图像语义理解能力,而且更贴近人类描述习惯,具有良好的可解释性。
-
公开(公告)号:CN119723077A
公开(公告)日:2025-03-28
申请号:CN202411738371.X
申请日:2024-11-29
Applicant: 中国矿业大学
IPC: G06V10/26 , G06V10/52 , G06V10/80 , G06V10/77 , G06V10/82 , G06V10/764 , G06N3/0455 , G06N3/0464 , G06N3/084
Abstract: 本发明提出一种基于边缘先验引导的多尺度融合弱监督语义分割模型及方法,属于计算机视觉领域。模型采用权重共享的孪生网络,包括特征提取模块、伪标签生成模块、自对应蒸馏模块和分割模块,在Segformer编码器基础上增加边缘信息提取模块以及边缘信息融合模块,边缘先验与编码器生成的多尺度特征深度融合可以改善伪标签边缘模糊,同时在不引入外部监督的情况下使用自对应蒸馏的方法提炼伪标签。通过计算像素级变化来增强伪标签的局部一致性,提高了伪标签的生成质量,进而提高了对图像的分割精度。本方法所提出的方法所需标注数据更少,标注成本更低。
-