基于注意力机制的目标变换方法

    公开(公告)号:CN109033095B

    公开(公告)日:2022-10-18

    申请号:CN201810866277.0

    申请日:2018-08-01

    Abstract: 本发明涉及一种基于注意力机制的目标变换方法,包括:训练神经网络模型:步骤1,使用随机数初始化神经网络模型的参数;步骤2,输入一张属于类别X的图像x到模型的生成器G中,进入编码阶段,x经过一个卷积层来计算出第一层特征图f1。利用上述训练得到的神经网络模型进行图像的目标变换,通过在模型中引入注意力机制,使模型能够在目标变化任务中识别出需要转换的目标物体,从而将目标和背景区分开。同时,通过构建注意力一致损失函数和背景一致损失函数来保证原始图像和转换图像的背景一致性。

    基于注意力机制的目标变换方法

    公开(公告)号:CN109033095A

    公开(公告)日:2018-12-18

    申请号:CN201810866277.0

    申请日:2018-08-01

    CPC classification number: G06F17/289 G06K9/20 G06N3/0454 G06N3/0481 G06N3/084

    Abstract: 本发明涉及一种基于注意力机制的目标变换方法,包括:训练神经网络模型:步骤1,使用随机数初始化神经网络模型的参数;步骤2,输入一张属于类别X的图像x到模型的生成器G中,进入编码阶段,x经过一个卷积层来计算出第一层特征图f1。利用上述训练得到的神经网络模型进行图像的目标变换,通过在模型中引入注意力机制,使模型能够在目标变化任务中识别出需要转换的目标物体,从而将目标和背景区分开。同时,通过构建注意力一致损失函数和背景一致损失函数来保证原始图像和转换图像的背景一致性。

    基于伪标签过滤的在线域变化持续学习方法及系统

    公开(公告)号:CN119206387A

    公开(公告)日:2024-12-27

    申请号:CN202411020101.5

    申请日:2024-07-29

    Abstract: 本发明提供一种基于伪标签过滤的在线域变化持续学习方法及系统,涉及计算机视觉技术领域,该方法包括获得预训练模型,利用预训练模型对变化的目标域数据进行预测,并生成伪标签进行在线自适应;基于二元分类推导出在线域变化持续学习中基于阈值过滤伪标签的引理,并根据引理设计在线域变化持续学习中的阈值设置原则;利用设计的阈值设置原则过滤模型预测置信度低的伪标签,同时通过引入类先验对齐方法来鼓励模型对未知域样本的公平预测;利用过滤后的伪标签对模型进行更新和优化,得到在线域变化持续学习中的分类预测结果。本发明建立了能够适应CTTA过程的自适应阈值,以保证伪标签的质量。

    基于孪生网络的RGB-D特征目标跟踪方法

    公开(公告)号:CN112785624B

    公开(公告)日:2023-07-04

    申请号:CN202110064596.1

    申请日:2021-01-18

    Abstract: 本发明公开了一种基于孪生网络的RGB‑D特征目标跟踪方法,包括以下步骤:构建基于RGB‑D特征的孪生网络模型;模板图像经共享网络处理,获得模板图像的语义特征,将高层语义特征输入至深度卷积网络模块,获得深度图;对深度图进行深度特征提取,获得深度特征信息,通过级联方式将深度特征信息与语义特征进行融合,获得融合后的图像特征;搜索图像经共享网络处理,获得搜索图像的特征,搜索图像的特征经卷积和池化操作,获得搜索图像的上下文信息,通过搜索图像的上下文信息指导融合后的图像特征,生成用于目标定位的自适应特征;将自适应特征与搜索图像通过共享网络处理获得的特征进行互相关操作,对分数图进行插值计算,获得跟踪的结果。其引入深度图,能够实现在复杂场景中高精度跟踪,效果好。

    基于注意力反馈机制的图像自动语句标注方法

    公开(公告)号:CN108960338B

    公开(公告)日:2021-10-08

    申请号:CN201810792426.3

    申请日:2018-07-18

    Abstract: 本发明涉及一种基于注意力反馈机制的图像自动语句标注方法,包括:构建输入数据,给定一系列的图像χ={x1,x2,...,xN}作为训练集,其中N是样本数量;图像xi对应的语句表述为si={si,1,si,2,...,si,T},T代表句子Si的长度;构建CNN‑RNN模型,进行正向文本成:从生成的文本中提取关键词注意力反向矫正图像注意力:利用上述从文本中提取出的关注特征,对原本的图像关注特征进行注意力矫正。能够解决注意力机制在图像自动语句标注过程中的注意力分散问题及生成语句错乱的问题,采用反馈式CNN‑RNN结构,利用反馈机制将生文本中的关键信息反向传给图像,将有利于在提取图像特征的过程中,更加关注文本中的信息所对应的显著目标,从而有利于使得图像关键信息和文本关键信息更加匹配。

    一种文本编辑图像方法、存储介质、电子设备及系统

    公开(公告)号:CN113158630A

    公开(公告)日:2021-07-23

    申请号:CN202110275765.6

    申请日:2021-03-15

    Abstract: 本发明公开了一种文本编辑图像方法、存储介质、电子设备及系统,其方法包括以下步骤:S1、将原始图像和原始图像的第一文本描述信息送入通道注意力模块进行关联,然后送入生成器,生成与文本相关的第一图像,将所述第一图像和第一文本描述信息送入鉴别器进行鉴别;S2、将所述第一图像和原始图像的第二文本描述信息送入通道注意力模块进行关联,然后送入生成器,生成与文本相关的第二图像,将所述第二图像和第二文本描述信息送入鉴别器进行鉴别;S3、利用步骤S1和S2得到的鉴别信息构建循环一致性损失函数,并经过多次迭代对生成器进行训练,得到优化后的生成器。本发明的文本编辑图像方法生成的图像更准确、更自然、更多样。

    基于孪生网络的RGB-D特征目标跟踪方法

    公开(公告)号:CN112785624A

    公开(公告)日:2021-05-11

    申请号:CN202110064596.1

    申请日:2021-01-18

    Abstract: 本发明公开了一种基于孪生网络的RGB‑D特征目标跟踪方法,包括以下步骤:构建基于RGB‑D特征的孪生网络模型;模板图像经共享网络处理,获得模板图像的语义特征,将高层语义特征输入至深度卷积网络模块,获得深度图;对深度图进行深度特征提取,获得深度特征信息,通过级联方式将深度特征信息与语义特征进行融合,获得融合后的图像特征;搜索图像经共享网络处理,获得搜索图像的特征,搜索图像的特征经卷积和池化操作,获得搜索图像的上下文信息,通过搜索图像的上下文信息指导融合后的图像特征,生成用于目标定位的自适应特征;将自适应特征与搜索图像通过共享网络处理获得的特征进行互相关操作,对分数图进行插值计算,获得跟踪的结果。其引入深度图,能够实现在复杂场景中高精度跟踪,效果好。

Patent Agency Ranking