一种基于二阶段注意力机制GAN网络图像修复算法

    公开(公告)号:CN112801895A

    公开(公告)日:2021-05-14

    申请号:CN202110053892.1

    申请日:2021-01-15

    Abstract: 本发明公开了一种基于二阶段注意力机制GAN网络图像修复算法,包括以下步骤:搭建基于GPU版本的Pytorch深度学习框架运行环境;准备数据集,每个数据集都有真实的图片和mask;搭建运行图像到图像的深度神经网络,包括生成器和判别器;进行泛化实验。生成器采用编码器-解码器结构,不断训练以生成预测图像;判别器衡量生成图像的真实性,以对抗损失作为损失函数。通过不断迭代联合优化生成器和判别器,以使网络预测性能提高。本发明能够训练实现端到端的自监督图像转换,既能用于学习输入图像到输出图像之间的映射关系,又能学习用于训练映射关系的损失函数。

    一种基于金字塔频域Transformer和复数卷积的无人机I/Q信号分类方法

    公开(公告)号:CN119961715A

    公开(公告)日:2025-05-09

    申请号:CN202411648314.2

    申请日:2024-11-18

    Inventor: 姚天辰 王彩玲

    Abstract: 本发明提出了一种基于金字塔频域Transformer和复数卷积的无人机I/Q信号分类方法,该方法包括:步骤1、用可学习的权重矩阵WQ、WK、WV对输入的复数信号特征向量xa进行线性计算,获得注意力机制的复矩阵输入Q、K、V,分别对Q、K、V引入傅里叶变换;步骤2、对于Transformer中的查询矩阵Q分别计算出相位和振幅,使用复数1×1卷积对相位和振幅的频率特征进行交互与整合;步骤3:对Transformer中的K引入自定义卷积核用于提取不同阶段的信号特征;步骤4:将步骤2和步骤3得到的注意力利用注意力分数公式计算,得到的结果输入至分类层进行映射,得到最后的分类结果。发明利用Transformer的全局特征提取能力和频域中信号特征更显著的特点,能有效提取无人机I/Q信号特征,实现无人机信号的高精度分类识别。

    一种基于伪孪生密集连接注意力机制的路面裂缝检测方法

    公开(公告)号:CN112819762B

    公开(公告)日:2022-10-18

    申请号:CN202110087473.X

    申请日:2021-01-22

    Abstract: 本发明公开了一种基于伪孪生密集连接注意力机制的路面裂缝检测方法,包括:步骤S1、获取数据集;步骤S2、对所述训练集中的图片进行预处理;步骤S3、构建伪孪生残差网络;步骤S4、设计伪孪生残差网络的损失函数,训练所述伪孪生残差网络直到所述损失函数收敛,保存模型;步骤S5、使用所述步骤S4中得到的模型检测所述测试中图片的裂缝。本发明通过改进传统的Encoder‑Decoder模型,使得可以有效的检测混合背景下即混合数据集下的检测结果;并且对损失函数进行优化,使其更适用于路面裂缝背景。

    一种基于生成性对抗网络的模态一致性跨模态检索方法

    公开(公告)号:CN111460201B

    公开(公告)日:2022-09-23

    申请号:CN202010143786.8

    申请日:2020-03-04

    Abstract: 本发明公开了一种基于生成性对抗网络的模态一致性跨模态检索方法,包括以下步骤:首先利用生成性对抗网络强大的数据分布建模能力,将文本特征映射到图像特征空间,用这种方法将跨模态检索问题转换为单模态检索问题,尽可能多地保留图像语义信息的同时减小模态的异质性。其次,设计了一个模态一致性哈希网络,将真实的图像特征和通过生成性对抗网络生成的特征投影到汉明空间中,并且利用标签信息对模态间和模态内的相似性进行建模,使得输出的哈希码在模态间和模态内具有更好的语义区分性,获得更具判别性的哈希码。最后在两个常用的基准数据集上的实验结果表明本方法与现有的流行方法相比具有更好的跨模态检索性能。

    一种基于特征图线性依赖的模型压缩方法

    公开(公告)号:CN114494478A

    公开(公告)日:2022-05-13

    申请号:CN202210191948.4

    申请日:2022-02-28

    Abstract: 本发明公开了一种基于特征图线性依赖的模型压缩方法,包括:统计神经网络模型中卷积层的个数以及每个卷积层中的通道数;通过输入少量的数据集,获取每个通道输出的特征图;基于特征图的信息熵,计算出每个通道在其所属的卷积层中的线性依赖独立性,并作为局部重要性;对于求出的局部重要性,基于遗传进化算法,求出每个卷积层的全局规模系数和全局偏差系数,把局部重要性转换成全局重要性;根据设置的目标压缩率,求出相应的阈值,并移除全局重要性小于阈值的通道,从而得到最优子网络;对得到的最优子网络进行自适应加权的多网络联合并行训练,恢复网络模型的性能。

    一种基于生成性对抗网络的模态一致性跨模态检索方法

    公开(公告)号:CN111460201A

    公开(公告)日:2020-07-28

    申请号:CN202010143786.8

    申请日:2020-03-04

    Abstract: 本发明公开了一种基于生成性对抗网络的模态一致性跨模态检索方法,包括以下步骤:首先利用生成性对抗网络强大的数据分布建模能力,将文本特征映射到图像特征空间,用这种方法将跨模态检索问题转换为单模态检索问题,尽可能多地保留图像语义信息的同时减小模态的异质性。其次,设计了一个模态一致性哈希网络,将真实的图像特征和通过生成性对抗网络生成的特征投影到汉明空间中,并且利用标签信息对模态间和模态内的相似性进行建模,使得输出的哈希码在模态间和模态内具有更好的语义区分性,获得更具判别性的哈希码。最后在两个常用的基准数据集上的实验结果表明本方法与现有的流行方法相比具有更好的跨模态检索性能。

    一种基于孪生卷积网络和长短期记忆网络的实时视觉目标跟踪方法

    公开(公告)号:CN110490906A

    公开(公告)日:2019-11-22

    申请号:CN201910771090.7

    申请日:2019-08-20

    Abstract: 一种基于孪生卷积网络和长短期记忆网络的实时视觉目标跟踪方法,首先对于待跟踪的视频序列,采用前后连续的两帧图像作为网络每次获取的输入;然后通过孪生卷积网络对输入的连续两帧图像进行特征提取,经过卷积操作后获取不同层次的外观和语义特征,再通过全连接层级联组合高低层次的深度特征;再将深度特征传输至包含两个LSTM单元的长短期记忆网络进行序列建模,由LSTM遗忘门对序列中不同位置的目标特征进行激活筛选,并通过输出门输出当前目标的状态信息;最后接收LSTM输出的全连接层用以输出目标在当前帧的预测位置坐标,并更新下一帧目标的搜索区域。在保证一定跟踪稳定性和准确性的同时大幅提高跟踪速度,令跟踪实时性得到较大改善。

    一种基于PSR的视觉跟踪错误修正方法

    公开(公告)号:CN108734722A

    公开(公告)日:2018-11-02

    申请号:CN201810346646.3

    申请日:2018-04-18

    Abstract: 本发明揭示了一种基于PSR的视觉跟踪错误修正方法,包括如下步骤:S1、计算出第一帧的相关滤波器;S2、限定实施错误修正的范围;S3、计算出 与 ;S4、将 与 进行比较;S5、提取目标在新状态下的特征;S6、重复上述步骤,完成后续检测修正。当出现物体遮挡、视角变化、目标形变、周围光照变化等情况时,本发明的方法可以通过使用第一帧训练得到的相关滤波器来对后续跟踪检测过程中的状态估计进行判定,若第一帧有比当前帧正在使用的滤波器更高的可信度,则使用第一帧来进行状态估计,从而减少了视觉跟踪过程中错误发生的几率,提高了视觉跟踪的精度。

    基于颜色名特征的行人重识别方法

    公开(公告)号:CN108664951A

    公开(公告)日:2018-10-16

    申请号:CN201810495801.8

    申请日:2018-05-22

    Abstract: 一种基于颜色名特征的行人重识别方法,包括如下步骤:S1、对行人图像进行预处理;S2、对经过预处理后的行人图像进行划分处理;S3、从经过划分处理后的行人图像中提取颜色名特征,并将提取出的颜色名特征与HSV特征、SILTP特征进行融合;S4、将S3中经过融合后的特征用二次判别分析法进行行人重识别。本发明基于颜色名特征、充分利用了行人外观的颜色特征,将每个通道相应位置元素的概率进行相比,并取其中最大的那个通道,用该通道标签表示该位置的像素,使得其能够更好的解决光照和环境变化对颜色描述的影响,从而保证了本发明的使用效果。

Patent Agency Ranking