-
公开(公告)号:CN119887928A
公开(公告)日:2025-04-25
申请号:CN202510361017.8
申请日:2025-03-26
Applicant: 南京信息工程大学
IPC: G06T7/73 , G06N3/0455 , G06N3/08 , G06V10/82 , G06V40/10
Abstract: 本发明公开了一种基于增强型拓扑感知网络的三维人体姿态估计方法,该方法包括获取人体动作捕捉数据集;构建增强型拓扑感知网络模型,该模型包括依次连接的特征嵌入块、重复堆叠5次的增强拓扑感知模块和回归头,增强拓扑感知模块包括时空双分支Transformer和混合约束模块;利用数据集对该模型进行训练,得到最终的增强型拓扑感知网络模型;将需要检测的人体图片或视频输入到最终的增强型拓扑感知网络模型中,得到每个关节对应的三维坐标,完成三维人体姿态的估计。本发明生成的三维姿态坐标更接近真实情况,准确性更高。
-
公开(公告)号:CN117808710B
公开(公告)日:2025-03-21
申请号:CN202311847371.9
申请日:2023-12-29
Applicant: 南京信息工程大学
IPC: G06T5/77 , G06N3/045 , G06N3/0499 , G06T5/10 , G06N3/08 , G06N3/0464 , G06F17/14 , G06V10/40 , G06V10/80 , G06V10/82 , G06V10/774 , G06V10/776
Abstract: 本发明公开了一种基于傅里叶变换Transformer网络的低光图像增强方法及装置,本发明首先获取若干低光图像及对应的参考标准图像,并对低光图像进行预处理,之后构建傅里叶变换Transformer网络,再将预处理后的低光图像和对应的正常光图像作为样本,对所述傅里叶变换Transformer网络进行训练;最后将待增强的低光图像输入训练好的傅里叶变换Transformer网络,得到增强后的图像。本发明可以对低光图像甚至极低光图像进行图像增强,增强后的图像效果相比现有技术更好。
-
公开(公告)号:CN114494283B
公开(公告)日:2025-03-04
申请号:CN202111602281.4
申请日:2021-12-24
IPC: G06T7/11 , G06T3/4007 , G06N3/0464 , G06V10/82 , G06N3/048 , G06V10/46
Abstract: 本发明公开了一种农田自动分割方法及系统,包括:获取原始的遥感影像,将原始的遥感影像裁剪成影像块,依次输入到农田粗分割网络的编码器模块,得到不同尺度下的农田特征;根据所述不同尺度下的农田特征和卷积网络中的浅层特征解码得到粗分割结果;利用粗分割结果定位所述原始的遥感影像中属于农田的像素,通过由卷积神经网络构成的农田细分割网络对所述像素进行二次判断,剔除粗分割结果中误分为农田的像素,得到细分割结果;将输入的所有影像块的细分割结果以均值叠加的方式拼接,完成原始大图的分割。优点:本发明能够解决农田尺度不一的问题以及避免将田埂等道路信息误分割为农田。
-
公开(公告)号:CN114373221B
公开(公告)日:2024-09-17
申请号:CN202111474169.7
申请日:2021-12-03
Applicant: 南京信息工程大学
IPC: G06V40/20 , G06N3/084 , G06N3/0464 , G06V10/82 , G06V10/44 , G06V10/764
Abstract: 本发明公开了一种融合几何结构特征图的手语识别方法、系统、装置及存储介质,属于手语识别技术领域;包括:获取手语视频,将其帧数和像素大小统一调整;将统一调整后的手语视频输入预建立的预先进行过训练的三维卷积神经网络,提取手语特征;将手语特征输入预建立的预先进行过训练的深度卷积生成对抗网络,生成手语特征图;将手语特征图的像素大小统一调整,根据手语特征图G通道和B通道的手部轨迹信息进行预分类,得到预分类类别;将统一调整后的手语特征图输入预建立的VGG16网络,输出特征向量,特征向量中值最高的元素在预分类类别对应的手语词汇库中对应的手语词汇为识别结果;提高手语识别的准确度和整体分类识别效率。
-
公开(公告)号:CN118571216A
公开(公告)日:2024-08-30
申请号:CN202411060512.7
申请日:2024-08-05
Applicant: 南京信息工程大学
Abstract: 本发明公开了基于语音语料对齐与自适应融合的语音分类方法,方法包括:构建语音分类数据集,并划分为训练集与测试集;构建语音分类网络模型,包括对齐构造模块、语音关联性构建模块、片段重要性挖掘模块、融合检测模块;将融合检测模块输出特征输入分类器以获得预测结果;设计用于优化网络模型参数的损失函数,根据损失函数在训练集上采用Adam优化器实现模型参数的迭代优化与更新;训练完成的语音分类网络模型可实现对语音信号的端对端分类。本发明利用深度学习技术通过语音信号实现自动分类,可应用于不同场景,如对情感、性别、年龄等特征的识别,有助于企业分析用户的情感、性别、年龄,从而提供更人性化、更具针对性的服务。
-
公开(公告)号:CN117808683A
公开(公告)日:2024-04-02
申请号:CN202311861793.1
申请日:2023-12-29
Applicant: 南京信息工程大学
IPC: G06T5/00 , G06V10/774 , G06V10/776 , G06V10/40 , G06V10/82 , G06N3/0464 , G06N3/045 , G06N3/0475 , G06N3/094
Abstract: 本发明公开了一种鲁棒的增量低光图像增强方法及装置,本发明采集一系列低光图像数据集以及相应的正常光图像,以构建增量样本库;构建域增量低光图像增强模型;按照训练顺序获取当前需要训练的样本域,实时对样本域进行预处理;利用经过预处理的训练数据集,对域增量低光图像增强模型进行训练;训练完后采用当前样本域验证集筛选出在测评指标上最高的域增量低光图像增强模型并保存;然后,采用所有旧域和当前域测试集对模型进行全面测试,评估增强效果和遗忘率,并使用当前模型参数更新下一增量阶段模型参数;完成针对所有域的训练,获得最终的域增量低光图像增强模型。本发明对动态变化的低光图像域进行自适应增强,增强后的图像效果相比现有技术更好。
-
公开(公告)号:CN117789055A
公开(公告)日:2024-03-29
申请号:CN202410028619.7
申请日:2024-01-09
Applicant: 南京信息工程大学
IPC: G06V20/13 , G06V10/44 , G06V10/774 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/08 , G06N5/04
Abstract: 本发明公开了基于因果推断的深度学习热带气旋强度实时估计和预报方法,包括:采集卫星云图数据以及ERA5再分析资料数据,并进行预处理,得到预处理后的卫星云图以及三个物理因子;基于CMA最佳路径集对预处理后的卫星云图进行标注;构建基于因果推断的深度学习热带气旋强度实时估计和预报模型,包括卫星云图特征提取模块、物理因子特征提取模块、基于因果推断的融合模块以及估计和预测模块;对构建的模型进行训练,得到训练好的模型,利用训练好的模型对当前和未来时刻的热带气旋强度进行估计和预报。本发明集成多源数据,以数理与统计范式相结合的方法增强热带气旋的深度提取特征,提出一种合理且具有可解释性的融合方法。
-
公开(公告)号:CN117788962A
公开(公告)日:2024-03-29
申请号:CN202410213054.X
申请日:2024-02-27
Applicant: 南京信息工程大学
IPC: G06V10/764 , G06V10/40 , G06V10/774 , G06V10/82 , G06V10/80 , G06N3/0455 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了基于持续学习的可扩展点云目标识别方法与系统,包括获取不同的点云目标识别数据集,基于预设类别将数据集划分为若干批次。然后基于PointNet网络,构建双分支结构的知识注入网络,该知识注入网络包括稳定性分支、以及可塑性分支;稳定性分支用于得到稳定性分支输出特征;可塑性分支用于得到可塑性分支输出特征;对稳定性分支输出特征、可塑性分支输出特征进行混合,得到混合知识特征。最后对混合知识特征输入至分类器,得到识别结果。本发明差异性局部感知模块提升了PointNet网络的差异性局部特征感知能力,通过知识注入网络设计,引入过去的模型特征知识进行多源知识补充,可以缓解对过去类别识别能力下降的现象。
-
公开(公告)号:CN115861930B
公开(公告)日:2024-02-06
申请号:CN202211602852.9
申请日:2022-12-13
Applicant: 南京信息工程大学
IPC: G06V20/52 , G06N3/0455 , G06N3/08
Abstract: 本发明公开了一种基于层级差异特征聚合的人群计数网络建模方法,步骤为,将人群图像数据集中的样本分辨率调整为统一大小并划分为人群计数网络训练集、人群计数网络验证集和人群计数网络测试集;对人群计数网络训练集进行数据增广;构建基于层级差异特征聚合的人群计数网络;利用人群计数网络训练集对人群计数网络进行训练,通过人群计数网络验证集进行最优模型筛选;在人群计数网络测试集上对最优网络模型进行测试。首先,本发明通过层级特征的差异对聚合的特征进行精炼。其次,通过自关注特征感知模块进一步挖掘有效信息,能够有效地提高人群计数的精度。
-
公开(公告)号:CN117237859A
公开(公告)日:2023-12-15
申请号:CN202311509301.2
申请日:2023-11-14
Applicant: 南京信息工程大学
IPC: G06V20/50 , G06V20/10 , G06V10/774 , G06V10/80 , G06V10/82 , G06V10/764 , G06N3/0464 , G06N3/045 , G06N3/084
Abstract: 本发明公开了基于低光照增强的夜间高速公路雾天能见度检测方法,包括:实时获取高速公路上的摄像头拍摄的夜间高速公路雾天情况的图像数据;输入至低光图像增强的能见度检测网络模型,该模型包括增强网络模块、亮通道先验计算模块、融合分类网络,分别获得夜间图像的深度视觉特征、亮度特征,并通过融合分类网络进行能见度预测,输出能见度等级分类;设计低光图像增强的网络模型的损失函数并进行训练;训练好的低光图像增强的网络模型实现对夜间图像进行低光照增强,并通过Transformer实现特征的融合分类,能够有效提升夜间高速公路雾天能见度检测的准确率。
-
-
-
-
-
-
-
-
-