-
公开(公告)号:CN104732186A
公开(公告)日:2015-06-24
申请号:CN201310700295.9
申请日:2013-12-18
Applicant: 南京理工大学
IPC: G06K9/00
Abstract: 本发明公开了一种基于局部子空间稀疏的单样本人脸识别方法,首先,对人脸图像进行块和子块两级划分,假设同一块内的子块在同一子空间内;然后基于稀疏表示用全部训练样本对应块内的所有子块去表示测试图像的对应块的中心子块,并计算表示系数;在此基础上求出各类别的重构残差,并依据最小残差原则确定测试图像块的类别;最后对所有测试图像块进行加权投票最终确定分类结果,各块权重可以根据稀疏表示系数的稀疏集中度计算得到。本发明不仅对表情、光照变化和遮挡等具有很好的鲁棒性,识别精度高,而且支持高效的并行计算,从而为单样本人脸识别问题提供了一种简单有效的解决方案。
-
公开(公告)号:CN118505495A
公开(公告)日:2024-08-16
申请号:CN202410666747.4
申请日:2024-05-28
Applicant: 南京理工大学
IPC: G06T3/04 , G06T7/73 , G06V40/10 , G06V10/42 , G06V10/44 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/045
Abstract: 本发明公开一种姿态引导图像合成方法、设备、存储介质及产品,涉及姿态引导图像合成领域,方法包括获取源图像和目标图像;根据源图像、目标图像、源图像姿势坐标、目标图像姿势坐标、源姿势、目标姿势以及与源图像对应的蒙版图像,采用渐进式条件扩散模型,生成姿态引导图像;渐进式条件扩散模型包括:依次连接的先验条件扩散模型、修复条件扩散模型以及精化条件扩散模型;本发明能够提高合成图像的质量以及保真性。
-
公开(公告)号:CN115983340A
公开(公告)日:2023-04-18
申请号:CN202211648157.6
申请日:2022-12-21
Applicant: 南京理工大学
IPC: G06N3/0464 , G06N3/048 , G06N3/098 , G06F18/241 , G06F9/50
Abstract: 本申请提供一种基于即插即用异构模型的联邦学习方法,包括:步骤1:训练生成模型:步骤2:初始化模型:步骤3:在各个客户端中训练客户端模型Mi,包括:步骤4:服务器聚合:在服务器端聚合来自客户端i的采样数据di~x~,y~∈d~,以及包括参与训练的数据量在内的参数;步骤5:服务器端数据分配:将采样数据集d~按照各个客户端私有数据的数据类别分布权重重新分配为子数据集di;并分配给各个客户端;步骤6:模型测试:步骤7:服务器端判断是否继续下一次通信。本申请提高了提高了模型训练的效果和效率。
-
公开(公告)号:CN109741270B
公开(公告)日:2022-09-09
申请号:CN201811535612.5
申请日:2018-12-14
Applicant: 南京理工大学
Abstract: 本发明提供了一种基于因式分解和均方差优化的双边滤波加速方法,包括以下步骤:输入待滤波的图像,计算其累积直方图;对值域滤波核函数进行因式分解得到滤波系数和逼近函数,进行均方差优化并对在二维网格上进行采样,得到矩阵;对矩阵进行奇异值分解,得到特征值和特征向量;对特征向量进行插值运算得到完整的函数;根据得到的滤波系数和逼近函数,迭代求和实现快速双边滤波,输出滤波结果图。
-
公开(公告)号:CN112315456B
公开(公告)日:2022-02-11
申请号:CN202011067849.2
申请日:2020-10-07
Applicant: 南京理工大学
Abstract: 本发明公开了一种基于跳接注意力机制的人体动作预测方法,包括:将归一化的每一帧的人体骨骼点坐标输入到由多层的自更新卷积门控循环网络组成的编码器中,提取人体骨骼点序列的分层特征;将编码器最后一个时间步提取的分层特征聚合得到人体动作的长期语义向量;将编码器最后一个时间步的各层隐藏变量作为解码器的初始隐藏变量,使用跳接注意力机制根据编码器的人体动作长期语义向量计算解码器每一层特征的权重;将调整后的分层特征和人体动作长期语义向量连接成新的特征,经过卷积神经网络生成待预测的人体骨骼点帧与前一帧的变化量,与输入骨骼点相加,再进行归一化数据还原,得到人体动作骨骼点的预测值。本方法可有效预测人体动作,准确率高。
-
公开(公告)号:CN113096013B
公开(公告)日:2021-11-26
申请号:CN202110348668.5
申请日:2021-03-31
Applicant: 南京理工大学
Abstract: 本发明提供了一种基于成像建模和知识蒸馏的盲图像超分辨重建方法及系统,将第一分辨率图像分别代入模糊核估计网络和深度图像超分辨率网络进行估计,分别获得深度内蕴特征知识图像和模糊核;根据模糊核、第一分辨率图像和深度内蕴特征知识图像进行图像复原,获得中间超分辨率图像,将中间超分辨率图像代入图像修正网络进行图像修正,获得第二分辨率图像;判断是否满足收敛条件;如果满足收敛条件,则输出第二分辨率图像;如果不满足收敛条件,则更新模糊核估计网络、深度图像超分辨率网络和图像修正网络。本发明通过设置图像修正网络对深度内蕴特征知识图像进行修正,进而剔除深度内蕴特征知识图像中出现伪影,进一步提高第二分辨率图像的分辨率。
-
公开(公告)号:CN112016456A
公开(公告)日:2020-12-01
申请号:CN202010880004.9
申请日:2020-08-27
Applicant: 南京理工大学
Abstract: 本发明涉及一种基于自适应反向投影深度学习的视频超分辨率方法及系统,包括:根据待处理视频帧序列块确定运动补偿邻帧特征;采用多幅图像神经网络得放大运动补偿邻帧特征集合;采用第二卷积层得参考帧特征;采用深度反向投影网络得放大参考帧特征;将放大参考帧特征与邻帧的放大运动补偿邻帧特征作差,对差值特征提取得差值特征;根据参考帧特征确定标准化注意力参数;差值特征点乘标准化注意力参数加上放大参考帧特征得隐藏特征;将隐藏特征保存于列表中;将缩小隐藏特征更新为参考帧特征,重复上述步骤,直到确定每个邻帧的隐藏特征;将列表中的隐藏特征拼接,采用第三卷积层得超分辨率图像。通过本发明上述方法能有效提升视频图像的重建结果。
-
公开(公告)号:CN111680692A
公开(公告)日:2020-09-18
申请号:CN202010431910.0
申请日:2020-05-20
Applicant: 南京理工大学
Abstract: 本发明公开了一种字符偏移检测方法及系统,所述方法包括:获取文本图像;基于所述文本图像进行字符分离,获得字符文本区域;计算所述字符文本区域中各矩形框的中心点,获得中心点集合;基于所述中心点集合确定最优拟合曲线;基于所述最优拟合曲线对字符偏移进行分析,获得偏移结果。所述系统包括获取模块、中心点集合确定模块、最优拟合曲线确定模块和偏移结果确定模块。本发明基于曲线拟合实现对字符偏移检测,提高检测的准确性。
-
公开(公告)号:CN111192343A
公开(公告)日:2020-05-22
申请号:CN201911298530.8
申请日:2019-12-17
Applicant: 南京理工大学
Abstract: 本发明公开了一种基于生成式对抗网络的人脸表情合成方法。该方法为:首先获取人脸表情的数据,对表情数据进行预处理,裁剪人脸图像,分为训练数据和测试数据,并将训练数据根据不同的表情强度手动划分成不同的类别;然后构造生成式对抗网络,在网络中加入对表情强度的判别信息和不同表情强度之间的关联信息;接着使用预处理好的表情数据对生成式对抗网络进行训练和测试,调节网络参数,使生成式对抗网络模型达到最优;最后选取中性表情的测试数据输入训练好的成式对抗网络模型,得到带有不同强度的表情图像。本发明能够通过中性无表情人脸图像合成不同强度的人脸表情图像,方法方便直观,合成的表情强度更加生动具有真实性。
-
-
-
-
-
-
-
-