-
公开(公告)号:CN117496151A
公开(公告)日:2024-02-02
申请号:CN202311529262.2
申请日:2023-11-16
Applicant: 重庆邮电大学
IPC: G06V10/26 , G06V10/80 , G06V10/52 , G06V10/44 , G06N3/0464 , G06N3/0455
Abstract: 本发明涉及基于多尺度注意力和双编码器的遥感图像语义分割方法,属于遥感图像语义分割技术领域。将Swin Transformer嵌入到基于CNN的残差网络中,形成并行的双编码器。关系聚合模块作为桥梁传递信息,利用全局特征引导主编码器获得更多的判别特征。通过具有高效通道注意力模块的多尺度跳跃连接,以利用多尺度特征并获得通道间的关系。位置注意力模块,获取任意两个位置特征图之间的空间依赖性,提高类内相关性和语义一致性。搭建基于多尺度注意力和双编码器的遥感图像语义分割网络模型。本发明有效的改善了语义分割中类内差异大,类间差异小等问题,显著得提高了语义分割模型的性能。
-
公开(公告)号:CN117290614A
公开(公告)日:2023-12-26
申请号:CN202311231321.8
申请日:2023-09-22
Applicant: 重庆邮电大学
IPC: G06F16/9536 , G06N3/042 , G06N3/0985
Abstract: 本发明涉及一种基于表征解耦的图协同过滤推荐方法,属于计算机技术领域。该方法包括以下步骤:S1:获取数据集;S2:数据预处理;S3:将数据构造成用户‑项目二分图;S4:构造图卷积模块,结合用户特征,项目特征,图结构来生成用户项目的嵌入;S5:构造top‑K生成器形成新的用户‑项目二分图,用户‑用户二分图,项目‑项目二分图;S6:图解耦层将预训练的用户项目嵌入进行解耦,生成最终的用户项目嵌入,并通过内积得到最终的推荐结果。本发明解决了基于图协同过滤的推荐算法中,因用户项目交互噪声以及图卷积层带来的嵌入语义不清的问题,使得推荐性能在原有的图协同过滤模型上获得提高。
-
公开(公告)号:CN116452818B
公开(公告)日:2024-12-10
申请号:CN202310501608.1
申请日:2023-05-06
Applicant: 重庆邮电大学
IPC: G06V10/40 , G06V10/25 , G06V10/764 , G06V10/766 , G06V10/82 , G06V10/80 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本发明涉及一种基于特征增强的小样本遥感图像目标检测方法,属于图像处理技术领域。该方法包括:先将遥感图像数据集进行划分处理,然后在训练阶段,将大量的基类数据输入特征提取网络;然后在特征提取网络后添加了一个上下文特征增强模块,通过利用指示对象类别存在或不存在的图像级上下文信息来选择性地加强类别感知特征,这能帮助目标检测器更好地理解场景。在小样本微调阶段,利用训练好的特征提取网络,冻结其部分参数,将平衡的基类和新类数据输入到网络中,再由后面RoI特征提取器和表示补偿模块获得修正后的提议框,再对新类别的遥感图像进行目标预测。本发明能够一定程度上解决遥感图像目标检测中的小样本问题。
-
公开(公告)号:CN116452818A
公开(公告)日:2023-07-18
申请号:CN202310501608.1
申请日:2023-05-06
Applicant: 重庆邮电大学
IPC: G06V10/40 , G06V10/25 , G06V10/764 , G06V10/766 , G06V10/82 , G06V10/80 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本发明涉及一种基于特征增强的小样本遥感图像目标检测方法,属于图像处理技术领域。该方法包括:先将遥感图像数据集进行划分处理,然后在训练阶段,将大量的基类数据输入特征提取网络;然后在特征提取网络后添加了一个上下文特征增强模块,通过利用指示对象类别存在或不存在的图像级上下文信息来选择性地加强类别感知特征,这能帮助目标检测器更好地理解场景。在小样本微调阶段,利用训练好的特征提取网络,冻结其部分参数,将平衡的基类和新类数据输入到网络中,再由后面RoI特征提取器和表示补偿模块获得修正后的提议框,再对新类别的遥感图像进行目标预测。本发明能够一定程度上解决遥感图像目标检测中的小样本问题。
-
公开(公告)号:CN117671414A
公开(公告)日:2024-03-08
申请号:CN202311537095.6
申请日:2023-11-17
Applicant: 重庆邮电大学
IPC: G06V10/774 , G06V10/82 , G06V10/764 , G06V10/52 , G06V10/80 , G06N3/0464
Abstract: 本发明涉及一种基于部分卷积嵌入和聚集分发机制的目标检测方法,属于计算机视觉技术领域。该方法包括:获取目标检测公共数据集,将其标注文件转换为YOLO格式文件,并划分为训练集、验证集和测试集;使用目标检测网络YOLOv8作为检测模型的主框架,搭建基于部分卷积嵌入和聚集分发机制的目标检测网络模型,包括空间特征提取模块和多尺度信息融合模块,通过将部分卷积嵌入到骨干网络来提取空间特征信息以及使用聚集分发机制增加模型的多尺度信息融合能力;基于训练集训练上述所改进的模型,得到最优的目标检测模型;本发明的目标检测模型在检测效率提高的同时对小目标检测能力更强,且拥有更高的总体精确度。
-
公开(公告)号:CN117571014A
公开(公告)日:2024-02-20
申请号:CN202311520271.5
申请日:2023-11-15
Applicant: 重庆邮电大学
Abstract: 本发明涉及一种结合图像描述和文本生成图像的视觉语言导航方法,属于视觉语言导航技术领域。该方法为:获取视觉语言导航任务的自然语言目标指令和当前所处位置的视觉图像;通过场景描述模块生成基于当前场景的详尽自然语言描述;通过文本生成图像模型生成与所描述场景有着类似核心物品对象以及核心场景布局的相似场景;将当前场景和对应相似场景通过多层Transformer结构和细尺度跨模态编码器进行编码;将当前场景编码和相似场景编码动态融合生成综合考虑了当前真实场景和对应相似场景的融合动作预测。该方法通过为任务训练提供额外的视觉数据输入,解决了视觉语言导航任务的数据稀缺问题,提高了智能体的任务性能和模型的泛化能力。
-
-
-
-
-