基于改进深度可分离卷积神经网络的图像着色方法

    公开(公告)号:CN112489164B

    公开(公告)日:2023-07-04

    申请号:CN202011420684.2

    申请日:2020-12-07

    Abstract: 本发明公开了一种基于改进深度可分离卷积神经网络的图像着色方法,包括以下步骤:构建图像数据集;构造改进深度可分离卷积着色神经网络;训练改进深度可分离卷积着色神经网络;将待着色灰度图像输入至训练后的轻量级着色神经网络,获得图像彩色化结果。本发明的网络结构对全局语义特征和局部像素特征进行综合考虑,并使用残差、深度可分离卷积、通道加权等方式减小参数并提高性能。

    一种高质量鲁棒部分相干成像方法及装置

    公开(公告)号:CN113391457B

    公开(公告)日:2022-09-20

    申请号:CN202110524638.5

    申请日:2021-05-13

    Abstract: 本发明涉及一种高质量鲁棒部分相干成像方法及装置,该方法将部分相干场表示为互不相关的完全相干场叠加,通过调控交叉谱密度函数中的相关参数以及目标强度灰度矩阵,在远场处对所需要的目标强度进行成像;通过将交叉谱密度函数离散化表示为不同模式的非相干叠加的形式,在数字微镜器件或者空间光调制器上连续播放不同的全息图,来实现不同模式的非相干叠加,从而高效地对所需要的目标进行成像。成像装置结构简单,并且实验能量利用率较高,鲁棒性好,具有非常实用的价值。

    基于改进深度可分离卷积神经网络的图像着色方法

    公开(公告)号:CN112489164A

    公开(公告)日:2021-03-12

    申请号:CN202011420684.2

    申请日:2020-12-07

    Abstract: 本发明公开了一种基于改进深度可分离卷积神经网络的图像着色方法,包括以下步骤:构建图像数据集;构造改进深度可分离卷积着色神经网络;训练改进深度可分离卷积着色神经网络;将待着色灰度图像输入至训练后的轻量级着色神经网络,获得图像彩色化结果。本发明的网络结构对全局语义特征和局部像素特征进行综合考虑,并使用残差、深度可分离卷积、通道加权等方式减小参数并提高性能。

    基于Logistic混沌映射的数字图像加密方法

    公开(公告)号:CN106530207A

    公开(公告)日:2017-03-22

    申请号:CN201611106799.8

    申请日:2016-12-06

    Inventor: 黄晶晶 王清华

    CPC classification number: G06T1/0021

    Abstract: 本发明公开了一种基于Logistic混沌映射的数字图像加密方法,灰度图像的每个像素值采用八位的二进制数来表示,将二维灰度图转换为一维的0和1的数码串来处理。根据给定的初始值由Logistic映射及生成混沌序列,对混沌序列进行排序,得到位置索引,根据位置索引对原始图像进行比特级的置乱操作,可以达到集像素融合和像素置乱于一体的图像加密结果。

    基于混合注意力机制和Transformer模型的DenseNet路面状态图像识别方法

    公开(公告)号:CN118038134A

    公开(公告)日:2024-05-14

    申请号:CN202410069280.5

    申请日:2024-01-17

    Abstract: 本发明公开了一种基于混合注意力机制和Transformer模型的DenseNet路面状态图像识别方法,包括:基于残差结构改进DenseNet网络作为骨干网络;建立并行的卷积注意力机制模块,将注意力模块引入FPN特征金字塔中,并将改进后的特征金字塔加入特征提取网络;构建Transformer模块,将Transformer模型与DenseNet网络结合,进行长距离建模;在Tensorflow学习框架下,利用训练集训练提出的网络模型,再用测试集验证效果,完成路面状态图像的识别。本发明通过注意力模块提高网络对主次信息的表征能力,DenseNet网络引入特征金字塔并结合Transformer模型,能够增强整体网络模型的特征提取能力,使得网络能够同时利用深层和浅层信息,提升网络对语义信息的理解和表达能力,进而显著提升了网络模型的分类准确率。

    基于Transformer的动态说话人脸图像生成系统及方法

    公开(公告)号:CN117671764A

    公开(公告)日:2024-03-08

    申请号:CN202311664241.1

    申请日:2023-12-05

    Abstract: 本发明公开了一种基于Transformer的动态说话人脸图像生成系统及方法,该系统包括生成网络和判别网络,生成网络包括全局语音特征提取模块、全局视觉特征提取模块、光流预测模块和图像渲染器;全局语音特征提取模块将输入的稀疏音频信号投影至高维空间,并从中提取语音特征;全局视觉特征提取模块从参考图像中提取出紧凑的视觉特征;光流预测模块用以计算真实视觉特征与参考视觉特征之间的差异,防止无关信息的泄漏;图像渲染器生成自然的嘴巴区域并潜嵌入原图像得到自然的动态说话人脸图像;判别网络用于监督生成模型的生成效果。本发明解决了动态说话人脸图像在生成时常见的信息泄露问题,并使生成结果有更高的唇形精度和图像质量。

    一种基于层级递进网络的单图像超分辨重建方法

    公开(公告)号:CN110047038B

    公开(公告)日:2022-11-04

    申请号:CN201910146330.4

    申请日:2019-02-27

    Inventor: 王清华 孙浩洋

    Abstract: 本发明提出了一种基于层级递进网络的单图像超分辨重建方法,其主要内容包括:特征提取分支、图像重建分支、层级递进网络结构、损失函数。该方法将高倍超分辨任务分解为多个子任务,每个子任务可以由一个超分辨单元网络单独完成,多个超分辨单元网络级联形成整个网络。本发明可以使用同一个训练模型对图像做多种倍数的超分辨重建处理。

    基于高效轻量级坐标神经网络的图像超分辨率方法

    公开(公告)号:CN111461976A

    公开(公告)日:2020-07-28

    申请号:CN202010194477.3

    申请日:2020-03-19

    Abstract: 本发明公开了一种基于高效轻量级坐标神经网络的图像超分辨率方法,包括以下步骤:构建图像数据集;构造高效轻量级坐标神经网络;训练高效轻量级坐标神经网络;将待处理图像输入至训练后的高效轻量级坐标神经网络,获得图像超分辨率结果。本发明的高效轻量级坐标神经网络通过结合金字塔结构的渐进式残差学习和递归密集块的递归学习,大大减小了网络的参数量,使得计算更加高效;通过引入坐标卷积使得超分辨率网络对图像高频特征的超分辨率能力大大提高。本发明的方法实现了网络轻量化且保持较高超分辨率精度的目的,并且在处理高尺度超分辨率任务时有着更好的性能。

    一种基于插值算法的关联成像优化方法

    公开(公告)号:CN110044474A

    公开(公告)日:2019-07-23

    申请号:CN201910146582.7

    申请日:2019-02-27

    Inventor: 王清华 成哲

    Abstract: 本发明公开了一种基于插值算法的关联成像优化方法,所述关联成像优化方法基于对应成像的思想、双线性插值算法和差分关联成像方案。本发明将双线性插值和差分关联成像方法进行有效结合,采用双线性插值对系统采集的图像信息进行压缩,利用压缩后的像素信息参与差分关联成像,借助对应成像的思想对差分信号进行时间上的对应分组,经过一定的迭代筛选之后重构出目标物体的图像,最后利用双线性插值算法将图像大小恢复至原尺寸。插值算法通过对灰度值的处理大幅削减了图像数据信息,同时提高图像质量,从而使得本发明兼具插值算法的方便和关联成像抗干扰能力强的优点。

    一种基于kinect2的动态手势识别方法

    公开(公告)号:CN106682585A

    公开(公告)日:2017-05-17

    申请号:CN201611096405.5

    申请日:2016-12-02

    Inventor: 凌晨 王清华

    CPC classification number: G06K9/00335 G06F3/017 G06K9/00389 G06K9/6278

    Abstract: 本发明公开了一种基于kinect2的动态手势识别方法,其特征在于,将动态手势的轨迹特征和手型特征分别建立隐马尔科夫模型,并利用朴素贝叶斯分类将手型识别结果和轨迹识别结果作为输入特征进行手势识别。本发明的基于kinect2的动态手势识别方法将复杂的动态手势过程分解为手型变化和轨迹运动变化,避免使用高维特征对手势进行描述,降低了运算的复杂度;由于加入了手型的特征,因此可以识别更多的手势,同时也进一步提高了识别手势的精确度。

Patent Agency Ranking