-
公开(公告)号:CN113158630B
公开(公告)日:2024-02-06
申请号:CN202110275765.6
申请日:2021-03-15
Applicant: 苏州科技大学 , 苏州佳图智绘信息技术有限公司
IPC: G06F40/166 , G06T11/60 , G06V10/44 , G06V10/82 , G06N3/0464 , G06N3/0455 , G06N3/0475 , G06N3/044 , G06N3/094 , G06V10/42
Abstract: 本发明公开了一种文本编辑图像方法、存储介质、电子设备及系统,其方法包括以下步骤:S1、将原始图像和原始图像的第一文本描述信息送入通道注意力模块进行关联,然后送入生成器,生成与文本相关的第一图像,将所述第一图像和第一文本描述信息送入鉴别器进行鉴别;S2、将所述第一图像和原始图像的第二文本描述信息送入通道注意力模块进行关联,然后送入生成器,生成与文本相关的第二图像,将所述第二图像和第二文本描述信息送入鉴别器进行鉴别;S3、利用步骤S1和S2得到的鉴别信息构建循环一致性损失函数,并经过多次迭代对生成器进行训练,得到优化后的生成器。本发明的文本编辑图
-
公开(公告)号:CN109033095B
公开(公告)日:2022-10-18
申请号:CN201810866277.0
申请日:2018-08-01
Applicant: 苏州科技大学
Abstract: 本发明涉及一种基于注意力机制的目标变换方法,包括:训练神经网络模型:步骤1,使用随机数初始化神经网络模型的参数;步骤2,输入一张属于类别X的图像x到模型的生成器G中,进入编码阶段,x经过一个卷积层来计算出第一层特征图f1。利用上述训练得到的神经网络模型进行图像的目标变换,通过在模型中引入注意力机制,使模型能够在目标变化任务中识别出需要转换的目标物体,从而将目标和背景区分开。同时,通过构建注意力一致损失函数和背景一致损失函数来保证原始图像和转换图像的背景一致性。
-
公开(公告)号:CN109033095A
公开(公告)日:2018-12-18
申请号:CN201810866277.0
申请日:2018-08-01
Applicant: 苏州科技大学
CPC classification number: G06F17/289 , G06K9/20 , G06N3/0454 , G06N3/0481 , G06N3/084
Abstract: 本发明涉及一种基于注意力机制的目标变换方法,包括:训练神经网络模型:步骤1,使用随机数初始化神经网络模型的参数;步骤2,输入一张属于类别X的图像x到模型的生成器G中,进入编码阶段,x经过一个卷积层来计算出第一层特征图f1。利用上述训练得到的神经网络模型进行图像的目标变换,通过在模型中引入注意力机制,使模型能够在目标变化任务中识别出需要转换的目标物体,从而将目标和背景区分开。同时,通过构建注意力一致损失函数和背景一致损失函数来保证原始图像和转换图像的背景一致性。
-
公开(公告)号:CN119206387A
公开(公告)日:2024-12-27
申请号:CN202411020101.5
申请日:2024-07-29
Applicant: 苏州科技大学
IPC: G06V10/774 , G06V10/764 , G06V10/82 , G06N3/0895 , G06N3/096
Abstract: 本发明提供一种基于伪标签过滤的在线域变化持续学习方法及系统,涉及计算机视觉技术领域,该方法包括获得预训练模型,利用预训练模型对变化的目标域数据进行预测,并生成伪标签进行在线自适应;基于二元分类推导出在线域变化持续学习中基于阈值过滤伪标签的引理,并根据引理设计在线域变化持续学习中的阈值设置原则;利用设计的阈值设置原则过滤模型预测置信度低的伪标签,同时通过引入类先验对齐方法来鼓励模型对未知域样本的公平预测;利用过滤后的伪标签对模型进行更新和优化,得到在线域变化持续学习中的分类预测结果。本发明建立了能够适应CTTA过程的自适应阈值,以保证伪标签的质量。
-
公开(公告)号:CN114463596B
公开(公告)日:2024-11-05
申请号:CN202111633547.1
申请日:2021-12-28
Applicant: 苏州科技大学 , 苏州市人民政府办公室 , 苏州佳图智绘信息技术有限公司
IPC: G06V10/774 , G06V10/764 , G06V10/74 , G06V10/82 , G06V20/70 , G06N3/045 , G06N3/0464 , G06N3/042 , G06N3/08
Abstract: 本发明涉及一种超图神经网络的小样本图像识别方法,利用卷积神经网络中空洞卷积的不同感受野来获取不同结构的多语义特征,构建多语义超图;利用超图神经网络聚合多语义超图中超节点的所有超边信息更新初始超节点特征表示,得到训练集的超节点特征表示;根据训练集的超节点特征表示,得到多语义分布信息,将多语义分布信息与训练集的超节点特征表示进行信息交互,通过相互迭代更新来不断优化多语义超图,得到训练集的目标超节点特征表示,根据训练集的目标超节点特征表示,计算得到训练集中查询集的分类结果。本发明通过超图结构的图像消息传递,捕获丰富的语义嵌入特征和多个语义分布特征,实现了小样本图像分类的识别。
-
公开(公告)号:CN113239961B
公开(公告)日:2023-10-20
申请号:CN202110384686.9
申请日:2021-04-09
Applicant: 苏州科技大学 , 苏州佳图智绘信息技术有限公司
IPC: G06T11/60 , G06F40/211 , G06N3/0475 , G06N3/094 , G06V30/19
Abstract: 本发明涉及一种基于生成对抗网络的文本生成序列图像的方法,该方法包括:构建训练数据库,训练数据库包括训练文本和与原始图像,利用训练文本和原始图像对生成对抗网络模型进行训练;生成对抗网络模型包括混合生成器和鉴别器,混合生成器包括场景图引导的图像生成器和基于序列条件的图像生成器;将待处理的文本输入至训练后的所述生成对抗网络模型中,由训练后的生成对抗网络模型生成与待处理文本相对应的图像并输出。本发明能够生成与文本描述相匹配的视觉上真实的图像,避免了对象布局混乱的问题,提高了输出图像的准确度。
-
公开(公告)号:CN112785624B
公开(公告)日:2023-07-04
申请号:CN202110064596.1
申请日:2021-01-18
Applicant: 苏州科技大学 , 苏州佳图智绘信息技术有限公司
Abstract: 本发明公开了一种基于孪生网络的RGB‑D特征目标跟踪方法,包括以下步骤:构建基于RGB‑D特征的孪生网络模型;模板图像经共享网络处理,获得模板图像的语义特征,将高层语义特征输入至深度卷积网络模块,获得深度图;对深度图进行深度特征提取,获得深度特征信息,通过级联方式将深度特征信息与语义特征进行融合,获得融合后的图像特征;搜索图像经共享网络处理,获得搜索图像的特征,搜索图像的特征经卷积和池化操作,获得搜索图像的上下文信息,通过搜索图像的上下文信息指导融合后的图像特征,生成用于目标定位的自适应特征;将自适应特征与搜索图像通过共享网络处理获得的特征进行互相关操作,对分数图进行插值计算,获得跟踪的结果。其引入深度图,能够实现在复杂场景中高精度跟踪,效果好。
-
公开(公告)号:CN108960338B
公开(公告)日:2021-10-08
申请号:CN201810792426.3
申请日:2018-07-18
Applicant: 苏州科技大学
IPC: G06K9/62 , G06N3/04 , G06F40/289 , G06F40/205
Abstract: 本发明涉及一种基于注意力反馈机制的图像自动语句标注方法,包括:构建输入数据,给定一系列的图像χ={x1,x2,...,xN}作为训练集,其中N是样本数量;图像xi对应的语句表述为si={si,1,si,2,...,si,T},T代表句子Si的长度;构建CNN‑RNN模型,进行正向文本成:从生成的文本中提取关键词注意力反向矫正图像注意力:利用上述从文本中提取出的关注特征,对原本的图像关注特征进行注意力矫正。能够解决注意力机制在图像自动语句标注过程中的注意力分散问题及生成语句错乱的问题,采用反馈式CNN‑RNN结构,利用反馈机制将生文本中的关键信息反向传给图像,将有利于在提取图像特征的过程中,更加关注文本中的信息所对应的显著目标,从而有利于使得图像关键信息和文本关键信息更加匹配。
-
公开(公告)号:CN113158630A
公开(公告)日:2021-07-23
申请号:CN202110275765.6
申请日:2021-03-15
Applicant: 苏州科技大学 , 苏州佳图智绘信息技术有限公司
IPC: G06F40/166 , G06T11/60 , G06K9/46 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种文本编辑图像方法、存储介质、电子设备及系统,其方法包括以下步骤:S1、将原始图像和原始图像的第一文本描述信息送入通道注意力模块进行关联,然后送入生成器,生成与文本相关的第一图像,将所述第一图像和第一文本描述信息送入鉴别器进行鉴别;S2、将所述第一图像和原始图像的第二文本描述信息送入通道注意力模块进行关联,然后送入生成器,生成与文本相关的第二图像,将所述第二图像和第二文本描述信息送入鉴别器进行鉴别;S3、利用步骤S1和S2得到的鉴别信息构建循环一致性损失函数,并经过多次迭代对生成器进行训练,得到优化后的生成器。本发明的文本编辑图像方法生成的图像更准确、更自然、更多样。
-
公开(公告)号:CN112785624A
公开(公告)日:2021-05-11
申请号:CN202110064596.1
申请日:2021-01-18
Applicant: 苏州科技大学 , 苏州佳图智绘信息技术有限公司
Abstract: 本发明公开了一种基于孪生网络的RGB‑D特征目标跟踪方法,包括以下步骤:构建基于RGB‑D特征的孪生网络模型;模板图像经共享网络处理,获得模板图像的语义特征,将高层语义特征输入至深度卷积网络模块,获得深度图;对深度图进行深度特征提取,获得深度特征信息,通过级联方式将深度特征信息与语义特征进行融合,获得融合后的图像特征;搜索图像经共享网络处理,获得搜索图像的特征,搜索图像的特征经卷积和池化操作,获得搜索图像的上下文信息,通过搜索图像的上下文信息指导融合后的图像特征,生成用于目标定位的自适应特征;将自适应特征与搜索图像通过共享网络处理获得的特征进行互相关操作,对分数图进行插值计算,获得跟踪的结果。其引入深度图,能够实现在复杂场景中高精度跟踪,效果好。
-
-
-
-
-
-
-
-
-