-
公开(公告)号:CN117710898A
公开(公告)日:2024-03-15
申请号:CN202410018018.8
申请日:2024-01-05
Applicant: 南昌大学
IPC: G06V20/52 , G06V10/762 , G06V10/764 , G06V10/74 , G06V10/774 , G06V10/80 , G06N3/0464 , G06N3/048 , G06N3/088
Abstract: 本发明公开了基于局部软注意力联合训练的无监督行人重识别方法,涉及行人重识别技术领域,将整个联合训练分为全局和局部两个分支,在局部分支中软注意力机制模块被提出来准确地捕捉局部区域的细微差异,进而提升Re‑ID模型对行人局部显著部位的鉴别能力,其次,双重交叉邻居标签平滑模块被设计来逐步缓解不同局部区域产生的不同程度的标签噪声,双重交叉邻居标签平滑模块模块通过全局与局部的相似性度量来实现行人全局与局部区域的语义对齐,随后通过邻近局部之间的交叉信息进一步建立局部区域之间的邻近关联性,进而实现整个训练过程中全局与局部区域的标签平滑,有效避免不同局部区域所包含的与身份无关信息会导致不同程度局部噪声的产生。
-
公开(公告)号:CN115909377A
公开(公告)日:2023-04-04
申请号:CN202211392147.0
申请日:2022-11-08
Applicant: 南昌大学
IPC: G06V30/41 , G06V30/14 , G06V30/148 , G06V30/162 , G06V30/19 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明提供了一种基于轻量化空洞网络的高效率文档版面分析方法,包括两个阶段:分割阶段和分类阶段;步骤A:在分割阶段,通过Otsu算法和RLSA将一个文档页面分割成多个内容块;步骤B:在分类阶段,提出一种轻量级扩张网络LD‑Net,LD‑Net将所有区块分类为图像、表格、文本和公式;每个单独的块及其分类标签在OCR系统的下一个过程中被处理。本发明提出了一种用LD‑Net进行布局分析的内存效率方法,当在低内存设备上使用时,它在精度和内存占用方面优于现有方法;LD‑Net是根据深度可分离卷积和剩余连接设计的,这两种结构使得网络高效且轻巧;扩张卷积在LD‑Net中被采用,它可以节省空间信息,这对提高所提方法的准确性很重要。
-