-
公开(公告)号:CN118571216B
公开(公告)日:2024-11-01
申请号:CN202411060512.7
申请日:2024-08-05
Applicant: 南京信息工程大学
Abstract: 本发明公开了基于语音语料对齐与自适应融合的语音分类方法,方法包括:构建语音分类数据集,并划分为训练集与测试集;构建语音分类网络模型,包括对齐构造模块、语音关联性构建模块、片段重要性挖掘模块、融合检测模块;将融合检测模块输出特征输入分类器以获得预测结果;设计用于优化网络模型参数的损失函数,根据损失函数在训练集上采用Adam优化器实现模型参数的迭代优化与更新;训练完成的语音分类网络模型可实现对语音信号的端对端分类。本发明利用深度学习技术通过语音信号实现自动分类,可应用于不同场景,如对情感、性别、年龄等特征的识别,有助于企业分析用户的情感、性别、年龄,从而提供更人性化、更具针对性的服务。
-
公开(公告)号:CN118735978A
公开(公告)日:2024-10-01
申请号:CN202411210367.6
申请日:2024-08-30
Applicant: 南京信息工程大学
IPC: G06T7/50 , G06V10/80 , G06V10/82 , G06N3/0455
Abstract: 本发明公开了图像处理领域的一种单目图像深度估计方法和存储介质,方法包括:获取待估计的单目图像并预处理;将图像输入预先训练的初步深度估计网络和迭代优化网络,获得最终的单目图像深度估计结果;初步深度估计网络包括编码器、解码器和回归头,解码器包含解码层,解码层采用三元组交叉注意力TCA模块,TCA模块对图像的处理包括:WCA模块计算注意力,输出窗口注意力特征;CDA模块计算注意力,输出跨维度注意力特征;REA模块计算注意力,输出相关性注意力特征;FBSF模块融合WCA、CDA和REA模块的输出结果,生成本解码层的输出特征。能够兼顾局部、全局信息和信息间的相关性得到更准确的单目图像深度估计结果。
-
公开(公告)号:CN117542057B
公开(公告)日:2024-04-05
申请号:CN202410029931.8
申请日:2024-01-09
Applicant: 南京信息工程大学
Abstract: 本发明公开了一种基于模块化网络建模视角间关系的多视角聚类方法,该方法包括以下步骤:通过提取数据不同视角的特征,构建多视角数据库;构建基于模块化的编码器‑解码器神经网络提取并训练得到多视角数据的统一表达;将统一表达进行转换并构造辅助优化目标函数;基于上述目标函数对模块化的编码器‑解码器中的编码器进行再优化获得优化的多视角数据统一表达;对多视角数据统一表达进行聚类得到多视角聚类结果。本发明利用模块化的编码器‑解码器神经网络进行多视角数据的统一表达获取,可以灵活且有效地建模多视角数据之间的关系,通过辅助优化目标函数进行编码器的优化,将进一步提升多视角聚类的性能。
-
公开(公告)号:CN117237859B
公开(公告)日:2024-02-13
申请号:CN202311509301.2
申请日:2023-11-14
Applicant: 南京信息工程大学
IPC: G06V20/50 , G06V20/10 , G06V10/774 , G06V10/80 , G06V10/82 , G06V10/764 , G06N3/0464 , G06N3/045 , G06N3/084
Abstract: 本发明公开了基于低光照增强的夜间高速公路雾天能见度检测方法,包括:实时获取高速公路上的摄像头拍摄的夜间高速公路雾天情况的图像数据;输入至低光图像增强的能见度检测网络模型,该模型包括增强网络模块、亮通道先验计算模块、融合分类网络,分别获得夜间图像的深度视觉特征、亮度特征,并通过融合分类网络进行能见度预测,输出能见度等级分类;设计低光图像增强的网络模型的损失函数并进行训练;训练好的低光图像增强的网络模型实现对夜间图像进行低光照增强,并通过Transformer实现特征的融合分类,能够有效提升夜间高速公路(56)对比文件文星等.面向路灯照明自适应调节的雾天能见度分类《.无线电通信技术》.2023,第49卷(第2期),第325-330页.张晨.雾天条件下图像可见度复原算法研究《.中国优秀硕士学位论文全文数据库 信息科技辑》.2021,(第1期),第I138-2024页.沈克成等.可见光-远红外图像的多模态能见度深度学习模型《.计算机辅助设计与图形学学报》.2021,第33卷(第6期),第939-946页.Jiaping Li等.A Transfer LearningMethod for Meteorological VisibilityEstimation Based on Feature FusionMethod《.applied sciences》.2021,第11卷(第3期),第1-21页.
-
公开(公告)号:CN117540023A
公开(公告)日:2024-02-09
申请号:CN202410021947.4
申请日:2024-01-08
Applicant: 南京信息工程大学
IPC: G06F16/35 , G06F40/30 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了基于模态融合图卷积网络的图像联合文本情感分析方法,包括:获取包含用户情感信息的图像以及文本数据;构建基于模态融合图卷积网络的图像联合文本情感分析模型,包括图文特征提取模块、语义增强图卷积模块和全局融合模块;设计损失函数,采用Adam优化器实现模型参数的迭代优化与更新;训练完成的网络模型能够实现对用户情感倾向的端到端分类。本发明利用深度学习技术,通过用户在社交平台上发布的图像与文本信息准确分析其情感倾向,有助于企业分析客户对相关产品的态度倾向,亦有助于社交媒体平台通过用户浏览的图文内容判断其喜好。
-
公开(公告)号:CN116665063A
公开(公告)日:2023-08-29
申请号:CN202310926894.6
申请日:2023-07-27
Applicant: 南京信息工程大学
Abstract: 本发明公开了基于自注意力和深度卷积并行的高光谱重建方法,属于计算机视觉图像处理技术领域。包括以下步骤:在编码阶段,利用CASSI光学系统进行压缩采样得到二维测量值,再经过反转色散过程,获得初始化信号;解码阶段,采用本方法提出的基于transformer和CNN并行架构的重建算法将2D压缩图像重建为3D高光谱图像,通过训练网络学习二维压缩测量数据到原始数据的逆变换,进一步使用训练好的模型重建压缩感知高光谱图像,实现了压缩感知高光谱图像的快速、精确重建,与传统迭代重建算法相比,在重建质量上有所提高,并且在重建高光谱数据上的计算时间上有显著提高,远快于传统算法。
-
公开(公告)号:CN112329818B
公开(公告)日:2023-07-07
申请号:CN202011124146.9
申请日:2020-10-20
Applicant: 南京信息工程大学
IPC: G06V10/764 , G06V10/762 , G06V10/772 , G06V10/26 , G06V10/82 , G06N3/0464 , G06N3/042 , G06N3/045 , G06N3/08
Abstract: 本发明公开了一种基于图卷积网络嵌入表征的高光谱图像非监督分类方法,包括:对待高光谱图像依次进行EMP和光谱特征提取,得到空谱联合特征;对空谱联合特征进行超像素分割,获得待高光谱图像的超像素点;求解超像素点的解弹性网表示,将解弹性网表示的表示系数中非零分量所关联的超像素点作为当前点的近邻,构建超像素点的图模型;基于图模型进行图卷积网络嵌入表征学习,通过层次化的顶点汇聚操作获得低维特征;根据低维特征表示,利用K‑means算法实现高光谱图像的非监督分类,其可以实现对高光谱图像进行精准分类的目的。
-
公开(公告)号:CN112258526B
公开(公告)日:2023-06-27
申请号:CN202011199922.1
申请日:2020-10-30
Applicant: 南京信息工程大学
Abstract: 本发明公开了一种基于对偶注意力机制的CT肾脏区域级联分割方法,包括如下步骤:S101、对原始CT图片进行预处理操作,获得训练数据集;S102、设计三维对偶注意力机制模块,充分提取完备的特征信息;S103、构建三维对偶注意力模块驱动的CT图像肾脏感兴趣区域级联分割网络;S104、设计级联分割网络的损失函数,并学习网络参数;S105、将S101得到的训练数据下采样一倍作为输入,送入S103的级联分割网络的第一级粗分割网络;把第一级粗分割网络的结果上采样一倍,与原始输入的训练数据融合后送入第二级细分割网络学习,并获得最终分割结果。本发明可以显著提高对肾脏及其感兴趣区域的分割精度。
-
公开(公告)号:CN111401201B
公开(公告)日:2023-06-20
申请号:CN202010164167.7
申请日:2020-03-10
Applicant: 南京信息工程大学
IPC: G06V20/17 , G06V10/25 , G06V10/80 , G06V10/82 , G06N3/0464
Abstract: 本发明公开了一种基于空间金字塔注意力驱动的航拍图像多尺度目标检测方法,包括以下步骤:首先针对大尺寸数据集运用分块处理方法增强训练数据集理;设计卷积注意力增强特征表示的残差网络作为基干网络,进而高效提取图像特征;进一步构建空间金字塔注意力模块,促使网络能够更加的准确聚焦不同尺度的目标,提取目标所在的感兴趣区域;建立目标类别分析与目标框回归模块,对不同尺度下感兴趣区域进行分类与目标框预测;在测试阶段用训练好的检测网络,采用多尺度测试策略,再通过全局集成非极大值抑制算法,融合不同尺度的检测结果,进一步提升检测准确率。
-
公开(公告)号:CN114627382A
公开(公告)日:2022-06-14
申请号:CN202210508579.7
申请日:2022-05-11
Applicant: 南京信息工程大学
IPC: G06V20/10 , G06V20/52 , G06V20/58 , G06V10/774 , G06V10/764 , G06V10/80 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本申请涉及一种联合行道线几何先验的高速公路雾天能见度检测方法。该方法包括:实时获取高速公路上的摄像头拍摄的高速公路雾天情况的图像数据;将高速公路雾天情况的图像数据输入到训练好的双分支分类网络模型的行道线检测分支和深度神经网络视觉特征提取分支,对应输出行道线检测标签和道路区域的视觉特征;训练好的双分支分类网络模型的融合分类模块根据行道线检测标签计算高速公路可见区域的长度特征,并融合道路区域的视觉特征进行分类,确定摄像头拍摄的高速公路对应的雾天能见度等级,联合行道线长度特征进行分类,分类准确度高,从而提高了高速公路雾天能见度检测的准确率。
-
-
-
-
-
-
-
-
-