-
公开(公告)号:CN112966648B
公开(公告)日:2023-10-10
申请号:CN202110319459.8
申请日:2021-03-25
Applicant: 南京工程学院
Abstract: 本发明公开了一种基于核扩展块字典稀疏表示的遮挡人脸识别方法,包括步骤(S1)):构建训练样本集X,将训练样本集X划分为B个训练块样本集#imgabs0#步骤(S2):构建标准样本集N;步骤(S3):构建测试样本集Y;步骤(S4):构建训练块样本#imgabs1#的遮挡字典#imgabs2#和待测块样本#imgabs3#的遮挡字典#imgabs4#得到混合完备遮挡块字典#imgabs5#步骤(S5):根据混合完备遮挡块字典#imgabs6#采用SRC模型对待测样本进行线性稀疏表示分类,进行该待测样本的遮挡人脸识别。本发明通过对原始图像分块,构建块图像集,其目的是充分考虑非约束人脸图像数据的复杂性,以及人脸空间拓扑信息在遮挡人脸识别中的重要性,相比原始图像,块图像更集中关注人脸结构特征或遮挡信息,更有利于遮挡人脸的准确识别。
-
公开(公告)号:CN116168434A
公开(公告)日:2023-05-26
申请号:CN202211710159.3
申请日:2022-12-29
Applicant: 南京工程学院
Abstract: 本发明公开了一种基于鲁棒稀疏保持判别分析的视频人脸识别方法,本发明通过高斯混合模型对人脸视频数据进行建模,可以更精确的捕捉多模态密度分布的数据变化信息,数据建模更准确,通过采用对数函数将SPD矩阵从非线性黎曼流形空间映射到线性切空间,降低了算法的计算复杂度,通过鲁棒稀疏保持判别分析对高维人脸视频数据进行降维,在求解鲁棒稀疏邻接图时,通过引入加权重构约束和类内紧凑度约束,可以有效提取出高维人脸视频数据的低维本征结构,同时在保持低维人脸视频数据样本的局部重构关系的基础上,又考虑了低维人脸视频数据样本的全局分布信息,能够在最大程度上保留高维人脸视频数据的本征结构,提高数据低维表示的准确性。
-
公开(公告)号:CN113963421A
公开(公告)日:2022-01-21
申请号:CN202111354855.0
申请日:2021-11-16
Applicant: 南京工程学院
Inventor: 童莹
Abstract: 本发明公开了基于混合特征增强网络的动态序列非约束表情识别方法,涉及面部表情识别技术领域,包括如下步骤,步骤1、对人脸表情视频数据进行人脸检测,截取人脸ROI区域,去除背景干扰,得到动态序列人脸表情数据;步骤2、将动态序列人脸表情数据以N帧为一组的分为多组序列,并对多组序列进行分析,提取它们的表情特征,且每组序列之间有N/2帧图像重叠;步骤3、将每组的N帧图像顺序输入单帧特征增强CNN网络和多帧特征增强自注意网络,得到N个2048维特征向量。本发明有效提高了动态序列面部表情特征的判别能力,缩小了非约束表情数据的类内差距;本发明提出的浅层特征增强模块通过增加网络宽度提高表情特征的判别能力,而且有效降低了计算复杂度。
-
公开(公告)号:CN111523461A
公开(公告)日:2020-08-11
申请号:CN202010324539.8
申请日:2020-04-22
Applicant: 南京工程学院
Abstract: 本发明公开了一种基于增强CNN和跨层LSTM的表情识别系统与方法,系统包括特征增强CNN模块、跨层LSTM模块和全连接层,特征增强CNN模块与跨层LSTM模块级联进行端到端训练;特征增强CNN模块在骨干CNN网络的中间层引出一条特征增强支路,并将特征增强支路的输出与骨干CNN网络的输出融合;跨层LSTM模块在至少两层LSTM网络级联的基础上,将特征增强CNN模块的输出输入到第一层LSTM网络,同时将特征增强CNN模块的输出跨接到后层LSTM网络的输入端。本发明有助于获取准确的视频序列表情时间信息,有效提高非约束人脸表情识别的准确率,在人机交互、智慧教育、病人监护等领域具有广大应用前景。
-
公开(公告)号:CN106022214B
公开(公告)日:2019-10-08
申请号:CN201610290463.5
申请日:2016-05-04
Applicant: 南京工程学院
IPC: G06K9/00
Abstract: 本发明提供一种非约束环境下的有效人脸特征提取方法,首先,构造多尺度主方向旋转梯度模板,包括3*3和5*5两个尺度的主方向旋转梯度模板;然后,对人脸图像中生物视觉ROI区域即感兴趣区域进行关键点标记,得到3*3尺度、5*5尺度的主方向旋转HOG特征,将k‑PDR‑HOG‑3和k‑PDR‑HOG‑5两个特征级联融合,得到最终的基于关键点的多尺度主方向旋转HOG特征。相比于原始的HOG算法,本发明构造的多尺度主方向旋转梯度模板在非约束环境下可以提取更为丰富全面的人脸特征,k‑MSPDR‑HOG特征具有强鲁棒性和高准确性。
-
公开(公告)号:CN108960313A
公开(公告)日:2018-12-07
申请号:CN201810674801.4
申请日:2018-06-26
Applicant: 南京工程学院
CPC classification number: G06K9/6269 , G06K9/46 , G06K2209/05 , G16H50/20
Abstract: 本发明提供一种基于Shearlet特征和层级二叉树SVM分类器的超声乳腺肿块分级检测方法,通过输入乳腺超声RF数据;提取Shearlet特征并降维,基于Shearlet变换实现乳腺肿块特征提取,基于LBP的Shearlet特征降维;采用层级二叉树SVM分类器进行乳腺肿块分级检测。该方法基于Shearlet变换进行乳腺肿块特征提取,可以准确描述不同分级的乳腺肿块特征差异,同时,基于LBP编码的降维算法,可以既不损失乳腺肿块特征信息,同时也降低了算法的计算复杂度,有利于提高算法的有效性;通过层级二叉树SVM分类器,可以对乳腺肿块进行有效分级;能够提高阅片的准确率,能够减少医生的主观因素影响,有助于提高医生诊断的准确率。
-
公开(公告)号:CN104778472B
公开(公告)日:2017-11-21
申请号:CN201510202840.0
申请日:2015-04-24
Applicant: 南京工程学院
Abstract: 本发明提供一种人脸表情特征提取方法,将人脸表情图像分为N个块图像,每个子图像的大小为m×n;由局部加权二值模式即LWBP分别计算出每个块图像中所有像素的LWBP1和LWBP2编码值;分别统计每个块图像的LWBP直方图;将块图像的两个直方图直接叠加得到直方图作为最终的块图像LWBP特征;将所有块图像的统计直方图顺序连接起来,得到用于分类识别的整个图像的LWBP特征向量。通过分别计算两组对称的共八个模板的加权灰度值,比较各个方向加权值与平均加权值的大小并进行编码,它综合考虑了不同方向上邻域像素的灰度变化,能够有效表征人脸表情细节特征,且对噪声有一定的鲁棒性,且识别速度明显加快,具有实用性。
-
公开(公告)号:CN119675780A
公开(公告)日:2025-03-21
申请号:CN202411786413.7
申请日:2024-12-06
Applicant: 南京工程学院
IPC: H04B10/516 , H04L27/00 , H04L27/36
Abstract: 本申请适用于信号传输技术领域,提供了一种基于四维概率成形的高安全多维光信号产生方法,包括:获取原始光信号数据,并对原始光信号进行串并变换,获得并行数据流;根据四维概率成形方法对并行数据流数据进行编码调制,设计四维1024QAM星座图,获得非均匀分布信号;对非均匀分布信号进行多混沌置乱处理,获得四维混沌数据;根据四维无载波幅度相位调制技术对四维混沌数据进行叠加,获得发送数据流;对发送数据流进行上采样处理,获得模拟信号;通过马赫曾德尔调制器将模拟信号加载到光载波上,生成光信号。由此,在提升多维多阶星座增益的同时可以提高光信号传输安全性。
-
公开(公告)号:CN118711086A
公开(公告)日:2024-09-27
申请号:CN202410798000.4
申请日:2024-06-20
Applicant: 南京工程学院
IPC: G06V20/17 , G06V10/25 , G06V10/762 , G06V10/774 , G06V10/82 , G06V10/98 , G06N3/08
Abstract: 一种基于课程学习策略的电力架空导线检测方法,对于数据集进行单样本多目标框标注,对架空导线进行分段标注分段检测,标记架空导线走向;对数据集图片进行基于小波‑熵的图像复杂度计算,将数据集划分为简单和复杂两种数据集,并先后将两种数据集送入YOLOv5网络进行训练、学习,进一步提高架空导线检测精度;针对YOLOv5网络检测后仍存在错误检测的架空导线图片,利用方向梯度统计进行目标框处理,去除错误检测框,保留完整且准确的架空导线目标检测框,保留完整且准确的架空导线。本发明在不扩大网络规模的情况下,实现了架空导线的高精度检测,为无人机架空导线自动巡检提供了新思路,推进了该领域的技术发展。
-
公开(公告)号:CN112904279B
公开(公告)日:2024-01-26
申请号:CN202110059164.1
申请日:2021-01-18
Applicant: 南京工程学院
IPC: G01S5/22 , G10L21/0208 , G10L21/0216 , G10L25/30 , G10L25/45 , G06N3/0464 , G06N3/084
Abstract: 本发明公开了一种基于卷积神经网络和子带SRP‑PHAT空间谱的声源定位方法,包括:麦克风阵列采集语音信号,对采集的语音信号进行分帧和加窗的预处理得到单帧信号;计算每帧信号的子带SRP‑PHAT空间谱矩阵;将所有帧信号的子带SRP‑PHAT空间谱矩阵输入训练完成的卷积神经网络,输出语音信号属于每个方位角的概率,取概率最大的方位角作为该语音信号的声源方位角估计值。本发明可提高麦克风阵列在复杂声学环境下的声源定位性能,提高对声源空间结构、混响和噪声的泛化能力;可离线完成卷积神经网络的训练过程,将训练好的卷积神经网络保存于内存中,测试时仅需要一帧信号就可以实现(56)对比文件Vecchiotti等.End-to-end Binaural Sound Localisation from the Raw Waveform.《IEEE》.2019,451-455.S. Jiang, W. L., P. Yuan, Y. Sun andH. Liu.Deep and CNN fusion method forbinaural sound source localization《.TheJournal of Engineering》.2020,511–516.张文涛;韩莹莹;黎恒.基于卷积神经网络的交通声音事件识别方法.现代电子技术.2018,(第14期),全文.Xiaoyan Zhao 等.Sound SourceLocalization Based on SRP-PHAT SpatialSpectrum and Deep Neural Network .《Computers, Materials & Continua 》.2020,第253-271页.
-
-
-
-
-
-
-
-
-