通过引入自监督复合任务训练生成对抗网络生成高质量图像的方法及装置

    公开(公告)号:CN114529622A

    公开(公告)日:2022-05-24

    申请号:CN202210033454.3

    申请日:2022-01-12

    Inventor: 魏莹 张见威

    Abstract: 本发明公开了一种通过引入自监督复合任务训练生成对抗网络生成高质量图像的方法及装置,包括以下步骤:(1)原始图像数据集以及拼接图像数据集准备;(2)设计用于实现生成对抗网络的自监督学习的复合任务;(3)搭建模型,构建对抗训练分支和自监督复合任务分支;(4)训练模型,并保存网络的参数;(5)使用训练好的生成器网络进行图像生成。本发明提供的通过引入自监督复合任务训练生成对抗网络生成高质量图像的方法,对图像内信息和图像间信息同时进行利用,构建了一个包含三个子任务的复合任务,引导网络学习图像中更稳定、更通用的特征,同时还构建了局部判别器来提高网络提取图像局部信息的能力,可显著提升网络的训练效果,提高最终生成的图像的质量。

    一种图像对象协同发现的方法

    公开(公告)号:CN108021920A

    公开(公告)日:2018-05-11

    申请号:CN201711098053.1

    申请日:2017-11-09

    Inventor: 张见威 赵菁

    Abstract: 本发明公开了一种图像对象协同发现的方法,包括下述方法:对图像数据集中的每一幅图像执行以下相同的操作,先基于图像显著性特征,完成粗糙的对象发现,将显著窗口中的对象作为协同发现的候选对象靶;再提取每一幅图像的强边缘‑Harris角点作为关键点,并以关键点为中心提取图像特征块;然后构造Color‑Texture‑Color‑Color四层聚类塔,对提取的图像特征块进行聚类,将所有的聚类中心图像块逐一匹配,确定各自归属的整个聚类的图像块之间匹配成功,标注成功匹配的所有聚类图像块的中心点,计算中心点的凸包,凸包发现的对象即为一个与候选对象靶相似的对象,实现了对象的协同发现。本发明可以更有效地对象发现,发现单幅图像对象的同时,利用对象之间的相似性,发现多幅图像中的相似对象。

    管道微机器人单轮直接驱动方法及其驱动装置

    公开(公告)号:CN1438167A

    公开(公告)日:2003-08-27

    申请号:CN03113927.2

    申请日:2003-03-17

    Abstract: 本发明是一种管道微机器人单轮直接驱动方法及其驱动装置,该方法采用弹性变形力与摩擦力组合作用的传动方式和结构,由单个与微电机轴固定联接的传动轮,通过一个传动驱动轮直接驱动微机器人运动;该装置由驱动器连接体、单传动轮、传动驱动轮、驱动轮、微电机和从动轮相互连接组成。采用本发明方法驱动的工业或医用微机器人,通过有线或无线控制微电机,可以实现微机器人的自动操控,提高工作效率。本发明使得管道微机器人的微驱动器结构大大简化、尺寸大大减小,成本也大为降低。

    基于注意力扰动的图像自动标注方法、系统和介质

    公开(公告)号:CN114359659B

    公开(公告)日:2024-09-06

    申请号:CN202111550104.6

    申请日:2021-12-17

    Abstract: 本发明公开了基于注意力扰动的图像自动标注方法、系统和介质,方法包括下述步骤:将待标注数据集划分为有标签数据集和无标签数据集,对有标签数据集进行图像增强以扩充数据集,并使用对应标签进行标注;构建基于注意力扰动机制的生成对抗网络,所述生成对抗网络包括图像自编码器、生成器和判别器;使用待标注数据集迭代训练生成对抗网络,同时使用扩充后的有标签数据集优化判别器的多任务全连接分类网络;使用训练好的判别器对无标签的待标注图像进行分类标注。本方法构建基于注意力扰动机制的生成对抗网络,同时引入多任务全连接分类网络,通过对抗训练,优化了图像特征表示,实现了图像的自动标注,提升了图像生成的多样性和质量。

    一种低分辨率图像中行人朝向的识别方法

    公开(公告)号:CN107767416B

    公开(公告)日:2020-05-22

    申请号:CN201710791630.9

    申请日:2017-09-05

    Inventor: 张见威 温春霞

    Abstract: 本发明提供了一种低分辨率图像中行人朝向的识别方法,包括下述步骤:(1)制作行人朝向数据集和标签,生成行人头部、腿部、全身三种训练样本;(2)对图像进行镜像处理和多尺度采样操作扩增训练数据集;(3)利用框架caffe进行训练,得到对应的神经网络模型;(4)利用(3)训练好的神经网络模型分别提取行人图像三通道特征;(5)利用Softmax分类器进行分类,得到最终的朝向识别结果。本发明提供了一种生成行人朝向图像数据集的方法,采取的镜像处理和多尺度采样等操作可有效扩增小数据集,减轻过拟合现象;通过深度学习训练的识别行人朝向的卷积神经网络模型能够提取更具区分度的特征,对行人图像三通道特征的加权使得朝向分类结果更加准确合理。

    一种通过搭建神经网络生成花鸟艺术字图像的方法

    公开(公告)号:CN109146989A

    公开(公告)日:2019-01-04

    申请号:CN201810749559.2

    申请日:2018-07-10

    CPC classification number: G06T11/001 G06N3/0454 G06N3/08 G06T5/002

    Abstract: 本发明提供了一种通过搭建神经网络生成花鸟艺术字图像的方法,包括以下步骤:(1)提出一个新的图像数据集,即ChineseArtCharacter360,包含360个汉字对应的360幅花鸟艺术字图像;(2)使用8‑connect块构建卷积神经网络作为生成器,构建马尔可夫卷积神经网络作为判别器并设计GLS损失函数作为网络总的损失函数;(3)将构建的图像数据集输入到生成器和判别器进行训练;(4)使用训练好的生成器进行花鸟艺术字图像的生成。本方法针对解决的问题可视作图像到图像的转换问题,通过搭建卷积神经网络,并设计GLS损失函数,可基于简单的输入获取任意汉字对应的花鸟艺术字图像,从而加速甚至省去传统复杂的手工和特殊画具的绘制过程。

    一种用于宫颈涂片图像中重叠细胞的分割方法

    公开(公告)号:CN104732229B

    公开(公告)日:2018-04-27

    申请号:CN201510114643.3

    申请日:2015-03-16

    Abstract: 本发明公开了一种用于宫颈涂片图像中重叠细胞的分割方法,通过以下步骤实现:(1)去除图像背景,提取前景对象,即重叠细胞组成的细胞团块;(2)分割出细胞核;(3)对细胞团块用均值漂移方法进行颜色分区,并用分水岭算法分割成子块;(4)搜索子块所有组合方式,用筛选条件进行过滤,符合条件的组合称为可能解;(5)对(4)得到的可能解,计算其能量泛函,选择函数值最小的为最优解。本发明以子块为单位选取最优可能解,缩小了解空间;提出了透光物体重叠部分的光照模型,对重叠子块判别提供了理论依据;设计的能量泛函综合细胞多种特征,据此选择的最优解据有合理性和有效性;提出的处理框架,可作为透光物体重叠区域分割的通用框架。

    一种用于宫颈涂片图像中重叠细胞的分割方法

    公开(公告)号:CN104732229A

    公开(公告)日:2015-06-24

    申请号:CN201510114643.3

    申请日:2015-03-16

    Abstract: 本发明公开了一种用于宫颈涂片图像中重叠细胞的分割方法,通过以下步骤实现:(1)去除图像背景,提取前景对象,即重叠细胞组成的细胞团块;(2)分割出细胞核;(3)对细胞团块用均值漂移方法进行颜色分区,并用分水岭算法分割成子块;(4)搜索子块所有组合方式,用筛选条件进行过滤,符合条件的组合称为可能解;(5)对(4)得到的可能解,计算其能量泛函,选择函数值最小的为最优解。本发明以子块为单位选取最优可能解,缩小了解空间;提出了透光物体重叠部分的光照模型,对重叠子块判别提供了理论依据;设计的能量泛函综合细胞多种特征,据此选择的最优解据有合理性和有效性;提出的处理框架,可作为透光物体重叠区域分割的通用框架。

    用于农业领域植物叶片和害虫类别的智能识别方法及装置

    公开(公告)号:CN118918370A

    公开(公告)日:2024-11-08

    申请号:CN202410970069.0

    申请日:2024-07-19

    Inventor: 夏钰龙 张见威

    Abstract: 本发明公开了一种用于农业领域不同植物叶片和不同害虫的分类方法及装置,方法包括:获取数据集并进行预处理;对数据集进行数据增强;构建基于自注意力机制的Vision Transformer骨干网络,提取图像的特征;通过显著性特征筛选引擎来选择骨干网络编码特征中最具辨别性区域对应的令牌用于分类;通过视觉结构感知器对选择出的令牌进行视觉结构感知来提取图像中对象的整体结构以辅助分类;对显著性特征筛选引擎和视觉结构感知器生成的特征进行随机部分交换丰富特征组合模式,并用可学习的参数将两部分的特征进行融合用于网络训练,利用训练后的网络对不同植物叶片和不同害虫进行分类。本发明可以对不同的植物叶片和病虫害图像进行高精度自动分类。

    基于多粒度特征学习的细菌性角膜炎和真菌性角膜炎裂隙灯图像分类方法

    公开(公告)号:CN117115896A

    公开(公告)日:2023-11-24

    申请号:CN202310881453.9

    申请日:2023-07-18

    Inventor: 刘健鑫 张见威

    Abstract: 本发明提供了一种基于多粒度特征学习的细菌性角膜炎和真菌性角膜炎裂隙灯图像分类方法,包括下述步骤:构建一个包含细菌性角膜炎和真菌性角膜炎的裂隙灯图像数据集,并处理成适当格式;对输入的图像数据集进行预处理;将预处理后的图像数据集输入到特征提取网络提取不同粒度的特征;对不同粒度的特征放入对比选择注意模块进行特征注意力增强;通过对增强后的不同粒度特征进行预测并结合渐进式知识正则化模块训练模型;使用训练好的网络模型对细菌性和真菌性角膜炎图像进行分类。本发明以多粒度特征模仿眼科专家由细节到整体、见微知著的诊断思路,提高自动诊断的精度和解释性。

Patent Agency Ranking