-
公开(公告)号:CN118115842A
公开(公告)日:2024-05-31
申请号:CN202311671810.5
申请日:2023-12-07
Applicant: 重庆邮电大学
IPC: G06V10/80 , G06V10/44 , G06V10/82 , G06N3/0464 , G06N3/048
Abstract: 本发明涉及一种双编码器‑单解码器的多层特征信息融合小目标检测系统,属于目标检测领域,包括编码器1、编码器2、解码器;编码器1用于对图像进行多次下采样卷积操作来提取特征,接着利用基于Transformer的骨干编码块TBEB实现局部‑全局特征的有效融合,随即进入空间池化SPPF将任意大小的特征图转化为固定大小的特征向量,减少参数、优化特征提取;编码器2经过多次颈部ECA注意力编码块SNEB编码来提升小目标区域的关注度,接着多次使用编码特征融合模块EFFM实现编码块之间浅层特征和深层特征的多层次信息融合;解码器对编码信息进行分类和回归,得到小目标检测结果。
-
公开(公告)号:CN117857823A
公开(公告)日:2024-04-09
申请号:CN202410075676.0
申请日:2024-01-18
Applicant: 重庆邮电大学
IPC: H04N19/96 , H04N19/176 , G06N3/0464 , G06N3/08
Abstract: 本发明涉及一种高效的多尺度CTU分区网络架构,属于视频编码领域。该网络架构包括一级预测结构、二级预测结构以及三级预测结构,其中,一级预测结构用于预测64×64CU是否需要划分,二级预测结构用于预测32×32CU是否需要划分;三级预测结构用于预测16×16CU是否需要划分;三级预测结构中包括多尺度特征提取层、深层特征提取层以及CU分区预测输出层,二级预测结构和一级预测结构中同样包括深层特征提取层以及CU分区预测输出层,而二级预测结构中是双尺度特征提取层,一级预测结构中是单尺度特征提取层。本发明对不同尺寸下CU的图像特征信息的提取,进而实现更加准确的CTU分区预测,从而降低HEVC的编码复杂度。
-
公开(公告)号:CN118115462A
公开(公告)日:2024-05-31
申请号:CN202410248044.X
申请日:2024-03-05
Applicant: 重庆邮电大学
Abstract: 本发明涉及一种基于三重辅助信号和频率编码的医学图像分割系统,属于图像分割技术领域,包括编码器、三个全局频率‑局部空间信息编码和聚合模块GLAM以及三重辅助信号模块TSSM;所述编码器用于对输入图像进行特征提取;所述全局频率‑局部空间信息编码和聚合模块用于在空间域中捕获多尺度局部特征,在频率域中利用全局频率信息;所述三重辅助信号模块用于指导浅层特征,利用病灶区域的前景、背景和边缘信息进行学习,对病灶区域进行图像分割。
-
公开(公告)号:CN118052707A
公开(公告)日:2024-05-17
申请号:CN202410061142.2
申请日:2024-01-16
Applicant: 重庆邮电大学
IPC: G06T3/4053 , G06V10/764 , G06V10/82
Abstract: 本发明涉及一种基于Transformer的局部与全局交互融合的轻量级超分辨率重建方法,属于图像超分辨率重建领域。该方法包括:将低分辨率输入浅层特征提取层进行特征提取,得到浅层特征;将浅层特征输入深层特征提取层,并经由RLGTG模块中LGTM模块提取得到深度特征,其中,LGTM模块由局部自注意力和全局自注意力交替设置组成;将深度特征输入图像重建部分,经过特征采样、特征聚合最终重建出高分辨率图像。本发明通过交替地开发图像中区域内的自注意和不同区域间的自注意力,同时实现了对图像局部信息和全局结构信息的显式捕捉。本发明能够重建出更高质量的超分辨率图像,同时具有较低的参数量和计算复杂度。
-
公开(公告)号:CN117689541A
公开(公告)日:2024-03-12
申请号:CN202311671815.8
申请日:2023-12-07
Applicant: 重庆邮电大学
IPC: G06T3/4053 , G06V10/764 , G06V10/80 , G06V10/82 , G06N3/0464 , G06V10/44
Abstract: 本发明涉及一种时间冗余优化的多区域分类视频超分辨率重建方法,属于计算机视觉领域。本发明提出了一种多区域划分块的有效方法,判断图像块是否能够提供有效的帧间信息,从而判断是否将该信息进行传播。为了进一步提高网络的重建效果,还将上采样过程进行了改进。以往的上采样方法都是采用双线性插值直接放大4倍,本发明采用两个级联的pixelshuffle(×2)层,采用两段渐进式的上采样策略可以减少直接双线性插值4倍上采样过程中的噪声,从而进一步提升视频超分辨率重建的性能。
-
公开(公告)号:CN118195951A
公开(公告)日:2024-06-14
申请号:CN202311671805.4
申请日:2023-12-07
Applicant: 重庆邮电大学
IPC: G06T5/73 , G06V10/44 , G06V10/82 , G06N3/0464 , G06N3/048
Abstract: 本发明涉及基于注意力的多尺度参数共享散焦图像去模糊方法,属于计算机视觉和深度学习技术领。方法包括:对输入图片进行两次下采样得到三个不同尺度的散焦模糊图像;将这些图像输入不同的卷积块以得到特征向量;利用上下文注意力模块和特征选择拼接模块对这些特征进行处理和提炼;将提炼后的特征进行聚合和压缩;最后,将压缩后的特征与原始输入图像合并,得到去模糊图像。本发明通过注意力机制和多尺度处理,有效地提高了去模糊效果,同时优化了模型参数,实现了参数共享,增强了模型的泛化能力。
-
公开(公告)号:CN117710299A
公开(公告)日:2024-03-15
申请号:CN202311690164.7
申请日:2023-12-11
Applicant: 重庆邮电大学
IPC: G06T7/00 , G06N3/0475 , G06N3/094 , G06N3/088
Abstract: 本发明涉及一种无监督全频信道选择重建图像的缺陷检测方法,属于计算机视觉和图像处理技术领域。该方法包括以下步骤:将原始图像输入频率解耦模块FD,得到全频图像;将全频图像作为输入,送入基于SE‑UNet网络和通道选择模块CS的生成对抗网络模块中,进行特征提取与整合,得到输出特征图V;将原始输入图像和生成器网络的输出作为判别器网络模块的输入,提取出能反映图像特性的有效特征,判断重建图像与原始图像之间的误差,并计算出模型中的总体异常分数,判断原始输入图像中是否存在缺陷。本发明能够有效地从原始图像中提取全频信息,并进行动态的信道选择与特征整合,从而实现基于全频重构的准确的异常检测。
-
-
-
-
-
-