一种基于子空间网络的少样本遥感场景分类方法

    公开(公告)号:CN117689958A

    公开(公告)日:2024-03-12

    申请号:CN202410019476.3

    申请日:2024-01-05

    Abstract: 本发明涉及一种基于子空间网络的少样本遥感场景分类方法包括:根据遥感场景图像数据集中遥感场景图像的类别将遥感场景图像数据集划分为训练集、验证集和测试集;根据划分好的训练集、验证集和测试集构建训练任务、验证任务和测试任务;建立基于子空间网络的少样本遥感场景分类模型,根据构建的训练任务设置损失函数;根据设置的损失函数,利用基于任务的元学习训练策略对基于子空间网络的少样本遥感场景分类模型进行元训练,在训练的同时,通过验证任务对基于子空间网络的少样本遥感场景分类模型进行元验证,保存性能最佳的模型,训练和验证过程完成后,通过测试任务对保存的性能最佳的模型进行元测试;本发明具有更好的分类性能和更高的稳定性。

    一种基于时空2D卷积神经网络的航拍视频分析方法

    公开(公告)号:CN113269054A

    公开(公告)日:2021-08-17

    申请号:CN202110485470.1

    申请日:2021-04-30

    Abstract: 本发明属于遥感影像智能化分析领域,具体涉及一种基于时空2D卷积神经网络的航拍视频分析方法,该方法包括实时获取航拍视频数据,对获取的航拍视频数据进行预处理;将预处理后的航拍视频数据输入到训练好的航拍视频识别模型中进行识别分析处理;对识别结果进行统计分析;所述航拍视频识别模型包括2D卷积神经网络、长时序特征提取模块LTFE、短期运动特征提取模块SMFE以及特征融合模块FFM,所述长时序特征提取模块LTFE、短期运动特征提取模块SMFE和特征融合模块FFM设置在2D卷积神经网络中;本发明采用改进的2D卷积神经网络模型并结合长时序特征提取模块、短期运动特征提取模块和特征融合模块,提高了计算效率以及航拍视频的识别准确率。

    基于特征融合的可见光图像转换红外图像的方法及设备

    公开(公告)号:CN119863378A

    公开(公告)日:2025-04-22

    申请号:CN202411952532.5

    申请日:2024-12-27

    Abstract: 本发明涉及一种基于特征融合的可见光图像转换红外图像的方法及设备,属于图像处理与计算机视觉技术领域。所述方法包括获取目标可见光图像和目标噪声图像;将所述目标可见光图像通过可见光预编码网络,得到目标可见光编码图像;将所述目标可见光图像通过预训练后的文本生成模型,得到目标可见光图像经过预设约束后的文本描述信息;将所述目标红外图像的文本描述信息通过预训练后的文本编码模型,得到目标红外图像的文本编码特征;将所述目标可见光编码图像、目标红外图像的文本编码特征以及目标噪声图像通过训练后的扩散模型进行特征融合,得到目标红外编码特征;将所述目标红外编码特征通过红外预解码网络,得到目标红外图像。本发明能够在提升图像生成质量的同时,避免引入巨大的计算成本。

    一种基于视觉Transformer的头部姿态估计方法

    公开(公告)号:CN119445619A

    公开(公告)日:2025-02-14

    申请号:CN202411566435.2

    申请日:2024-11-05

    Abstract: 本发明属于计算机视觉领域,具体涉及一种基于视觉Transformer的头部姿态估计方法,包括:构建头部姿态估计模型;获取待检测的图像,将图像输入到训练后的头部姿态估计模型中,得到头部姿态估计结果;所述头部姿态估计模型包括视觉Transformer预训练网络模块、多尺度Transformer编码器模块、CNN模块以及预测头模块;本发明通过图像翻折操作引入翻折图像,能够为原图像提供自监督信息,通过这种方式,模型可以学习到姿态变化的反向特征,使得模型能够捕捉到不同姿态下的相似性,进一步提升头部姿态估计的准确度和稳定性。

    一种基于时空2D卷积神经网络的航拍视频分析方法

    公开(公告)号:CN113269054B

    公开(公告)日:2022-06-10

    申请号:CN202110485470.1

    申请日:2021-04-30

    Abstract: 本发明属于遥感影像智能化分析领域,具体涉及一种基于时空2D卷积神经网络的航拍视频分析方法,该方法包括实时获取航拍视频数据,对获取的航拍视频数据进行预处理;将预处理后的航拍视频数据输入到训练好的航拍视频识别模型中进行识别分析处理;对识别结果进行统计分析;所述航拍视频识别模型包括2D卷积神经网络、长时序特征提取模块LTFE、短期运动特征提取模块SMFE以及特征融合模块FFM,所述长时序特征提取模块LTFE、短期运动特征提取模块SMFE和特征融合模块FFM设置在2D卷积神经网络中;本发明采用改进的2D卷积神经网络模型并结合长时序特征提取模块、短期运动特征提取模块和特征融合模块,提高了计算效率以及航拍视频的识别准确率。

    一种基于局部描述符的三原型矫正网络少样本遥感场景分类方法

    公开(公告)号:CN119963897A

    公开(公告)日:2025-05-09

    申请号:CN202510023170.X

    申请日:2025-01-07

    Abstract: 本发明属于人工智能领域,特别涉及一种基于局部描述符的三原型矫正网络少样本遥感场景分类方法,包括下载遥感数据集并根据遥感场景图像数据集中遥感场景图像的类别将遥感场景图像数据集划分为训练集、验证集;建立基于局部描述符的三原型矫正网络少样本遥感场景分类模型;利用基于任务的元学习训练策略对基于局部描述符的三原型矫正网络少样本遥感场景分类模型进行元训练,在训练的同时,通过验证任务对基于局部描述符的三原型矫正网络少样本遥感场景分类模型进行元验证,保存性能最佳的模型;利用性能最佳的模型对遥感图像进行分类。本发明可以有效缓解单原型网络对无关背景信息过度使用、无法有效捕获场景图像类特征的问题。

    一种基于教室场景的低分辨率交互行为识别方法

    公开(公告)号:CN119888558A

    公开(公告)日:2025-04-25

    申请号:CN202411797585.4

    申请日:2024-12-09

    Abstract: 本发明请求保护一种基于教室场景的低分辨率交互行为识别方法,本发明通过对低分辨率视频生成对应的高分辨率视频,使用高低双分辨率知识蒸馏模型来实现高分辨率视频信息对低分辨率网络支路的指导。本知识蒸馏模型采用的是离线蒸馏的方式,添加了自适应权重以此来让低分辨率网络支路学习正确的预测概率分布。通过将特征蒸馏损失和响应蒸馏损失联合作为低分辨率网络支路的蒸馏损失,与低分辨率网络支路的分类损失构成总体损失,以此对模型参数进行训练和更新,使得低分辨率网络支路可以学习到更多的知识。在推理阶段,低分辨率网络支路添加了自适应批处理归一化层,使得学习后的网络能够适应低分辨率行为识别。

    基于域差异信息的可见光图像转换红外图像的方法及设备

    公开(公告)号:CN119863379A

    公开(公告)日:2025-04-22

    申请号:CN202411952983.9

    申请日:2024-12-27

    Abstract: 本发明涉及基于域差异信息的可见光图像转换红外图像的方法及设备,属于图像处理与计算机视觉技术领域。所述方法包括获取目标可见光图像和目标噪声;所述目标噪声为随机噪声;将所述目标可见光图像通过预训练感知网络,得到目标域差异信息;将所述目标可见光图像通过训练后的扩散模型的编码器网络,将所述目标域差异信息通过训练后的扩散模型的解码器网络,得到目标红外图像。本发明首先学习红外图像与可见光图像之间的域差异特征,并将差异信息融合到图像的生成过程,使得红外图像与可见光图像转换质量更高。

Patent Agency Ranking