-
公开(公告)号:CN120067861A
公开(公告)日:2025-05-30
申请号:CN202510205875.3
申请日:2025-02-25
Applicant: 南京理工大学
IPC: G06F18/2415 , G06F18/2433 , G06F17/16 , G06N3/045 , G06N3/08 , G06N3/048
Abstract: 本发明公开了一种基于平坦梯度修改的交互多模态学习方法及虚假新闻检测系统,方法包括:处理原始样本为原始样本序列,并构建多模态深度学习模型;将原始样本序列输入至多模态深度学习模型得到预测结果并计算均值与方差;通过均值与方差计算感知矩阵,进行奇异值分解寻找平坦方向;引入锐度最小化优化方法,平坦多模态深度学习模型的优化目标;根据多模态深度学习模型的预测结果计算损失,并使用感知矩阵修改后的梯度进行参数更新以训练模型。本发明通过基于平坦梯度修改的交互多模态学习方法,缓解模态不均衡问题,训练得到优秀的多模态模型,提升多模态模型在分类下游任务的模型性能,可作为虚假新闻检测系统的核心方法。
-
公开(公告)号:CN114186799B
公开(公告)日:2025-05-06
申请号:CN202111381476.0
申请日:2021-11-21
Applicant: 南京理工大学
Abstract: 本发明公开了一种基于异构图神经网络的企业估值方法及系统,属于图神经网络领域。该方法包括如下步骤:搭建行业异构图;待估值企业邻居采样;对采样节点注意力聚合学习;加权融合异构节点的聚合特征;预测企业估值。本发明采用图神经网络作为基本模型,在异构图神经网络的聚合学习中引入公司节点和人员节点的连接信息并通过注意力机制融合;由于引入了图神经网络算法,相较于传统专家估值效率大幅度提升,在公司和人员信息变更、市场出现波动时,可以对企业估值快速更新;从行业领域信息从高层次视角聚焦公司估值,依托海量数据有效地解决了专家对企业直接建模导致的认知偏差和主观局限性。
-
公开(公告)号:CN119415725A
公开(公告)日:2025-02-11
申请号:CN202411355845.2
申请日:2024-09-27
Applicant: 南京理工大学
IPC: G06F16/583 , G06F16/334 , G06N3/096 , G06F16/38
Abstract: 本发明公开了一种基于多层次结构自感知的深度跨模态检索方法及系统,方法包括:处理原始样本为原始样本序列,原始样本包括成对图像、文本实体;将原始样本序列分别输入至跨模态网络并计算跨模态对比损失与跨模态匹配损失;将原始样本序列输入到单模态教师网络并计算表征蒸馏损失使跨模态网络学得单模态表征层面的最优跨模态表征;计算单模态网络与跨模态网络各自的样本相似度矩阵,融合两单模态网络相似度矩阵后与跨模态网络相似度矩阵计算结构自感知的关系蒸馏损失;对整体模型进行参数更新以训练模型。本发明通过跨模态匹配损失与多层次结构自感知蒸馏损失,学得优秀的跨模态一致性表征,保留单模态的结构完整性并提高跨模态检索效果。
-
公开(公告)号:CN115942041B
公开(公告)日:2024-08-02
申请号:CN202211654638.8
申请日:2022-12-22
Applicant: 南京理工大学
IPC: H04N21/44 , H04N21/845 , G06V20/40 , G06V10/774 , G06V10/74 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/0895 , G06N3/09
Abstract: 本发明公开了一种基于上下文感知的深度视频拆条方法及装置,属于计算机视觉领域,该方法包括如下步骤:预处理视频提取镜头信息;基于上下文感知深度模型提取镜头特征并预测镜头边界;基于半监督视频数据自监督训练上下文感知深度模型;基于训练模型进行评估。本发明采用卷积神经网络和上下文感知的深度自注意力网络作为基本模型,对视频提取局部和全局感知的镜头表示,解决了以往视频拆条算法中边界的复杂时间和语义结构感知困难的问题。通过镜头级别和场景级别的代理任务对卷积神经网络和上下文感知的深度自注意力网络进行参数学习,并通过有标记视频数据微调上下文感知的深度自注意力网络,有效地提升了视频拆条的精度。
-
公开(公告)号:CN114186080A
公开(公告)日:2022-03-15
申请号:CN202111381465.2
申请日:2021-11-21
Applicant: 南京理工大学
Abstract: 本发明公开了一种基于语义共享的深度跨模态检索方法及系统,属于多模态学习领域,该方法包括如下步骤:提取图片和文本的细粒度特征;使用共享模型学习多模态一致性表示;通过掩码预测和分类预测优化模型;基于模型进行跨模态检索。本发明采用深度自注意力网络作为基本模型,对多模态数据分别提取细粒度特征并使用共享模型在同一语义空间中学习不同模态数据的一致性表示,解决了以往跨模态算法使用一致性损失函数导致弱模态对强模态的干扰问题,通过标签预测和掩码预测多任务损失函数对共享深度自注意力网络模型进行参数学习,有效地提升了跨模态检索的精度。
-
公开(公告)号:CN108943823B
公开(公告)日:2020-04-07
申请号:CN201710382287.2
申请日:2017-05-26
Applicant: 南京理工大学 , 扬州市海力精密机械制造有限公司
IPC: B30B15/00
Abstract: 本发明公开了一种超大型粉末成型机的下横梁平衡装置,包括第一连接机构、第二连接机构、转向连接头、伸缩缸;所述第一连接机构包括固定支座、第一连接轴、法兰端盖、轴套、过渡轴套、法兰轴套、第一锁紧螺母;所述固定支座包括第一安装板、安装座;所述第一连接轴一端与安装座配合;所述第一连接轴另一端连接在连接头上端的转向头的轴孔内,并伸出轴孔;伸出轴孔端设有螺纹,采用第一锁紧螺母进行轴向定位;位于安装座与转向头之间,第一连接轴上设有轴肩,对第一连接轴轴向进行定位;伸缩缸下端固接有固定座,通过第二连接机构连接到下箱体底座上;本发明的平衡装置安装到设备上时可利用配合螺纹深度和伸缩缸旋转来微调位置实现灵活安装。
-
公开(公告)号:CN120067862A
公开(公告)日:2025-05-30
申请号:CN202510206134.7
申请日:2025-02-25
Applicant: 南京理工大学
IPC: G06F18/2415 , G06F18/214 , G06N3/045 , G06N3/092 , G06N3/048
Abstract: 本发明公开了一种基于强化学习的数据感知单模态采样方法及攻击性表达检测系统,方法包括:处理原始样本为原始样本序列,并构建多模态深度学习模型;将原始样本序列输入至多模态深度学习模型得到预测结果并计算累积模态差异分数;构建强化学习策略网络的决策系统,定义智能体、环境、状态、动作、奖励函数;将累积模态差异分数输入策略网络,得到下一轮采样数据量,并依照奖励函数更新策略网络;最后根据多模态深度学习模型的预测结果计算损失,进行参数更新以训练模型。本发明通过基于强化学习的单模态采样方法,缓解模态不均衡问题,训练得到优秀的多模态模型,提升多模态模型在分类下游任务的模型性能,可作为攻击性表达检测系统的核心方法。
-
公开(公告)号:CN106152962B
公开(公告)日:2018-12-14
申请号:CN201510160795.7
申请日:2015-04-07
Applicant: 南京理工大学
IPC: G01B11/16
Abstract: 本发明公开了一种基于管道爬行器的石油钻井套管形变检测方法,包括套管形变的类型检测和形变定位。由管道爬行器搭载摄像头在石油钻井套管中采集图像序列,查找图像序列并判断是否存在形变,若存在形变则进一步判断形变类型及形变在套管中所处的位置。针对形变的类型检测,通过Canny函数、Roberts函数、形态学梯度函数或高级轮廓提取函数对采集的图像序列进行处理从而识别形变类型;针对形变定位,通过获取图像关键帧的方式判断形变在套管中的位置,进而提出基于模板匹配与基于轮廓提取两种获取图像关键帧的方法。本发明能够准确地检测石油钻井套管的形变特征,从而排除油井勘探工程中由套管形变引起的安全隐患。
-
公开(公告)号:CN115331061A
公开(公告)日:2022-11-11
申请号:CN202211036205.6
申请日:2022-08-27
Applicant: 南京理工大学
IPC: G06V10/764 , G06V10/774 , G06V10/82
Abstract: 本发明公开了一种面向开放数据的半监督图像分类方法,该方法包括如下步骤:预先训练一个开放集分类器;过滤类外数据;使用半监督方法重新训练一个整体开放集分类器;扩展至增量开放集分类场景。本发明采用深度网络作为基本模型,首先在类内数据上预先训练一个开放集分类器作为教师模型完成特征提取,再过滤类外数据得到类外标记数据以及剩余的未标记测试数据,在此基础上形成半监督学习框架重新训练,可解决传统开放集识别算法中类外数据与类内数据语义混淆的问题;此外,本发明可以将模型有效地扩展为增量形式,以应对增量出现的未知类数据;该方法可应用于垃圾分类等开放集分类场景中,具有较强的工程应用价值。
-
公开(公告)号:CN114186613A
公开(公告)日:2022-03-15
申请号:CN202111381464.8
申请日:2021-11-21
Applicant: 南京理工大学
Abstract: 本发明公开了一种基于注意力机制多视图深度学习的球鞋真伪鉴定方法及系统,属于计算机视觉领域,该方法包括如下步骤:采集多视图球鞋图像数据;分别提取图像特征;注意力加权融合多视图特征;通过标记和未标记数据训练鉴别模型;预测球鞋真伪。本发明采用卷积神经网络作为基本模型进行图片特征提取,使用注意力机制自适应加权融合多视图特征拟合专家经验,通过标记数据学习模型鉴别能力并在大量的未标记数据上进行半监督学习提高模型的抗干扰能力和泛化性能,能够高效准确地鉴定球鞋真伪。本发明通过模型的灵活部署,可以实现从销售源头检测仿冒球鞋和在销售终端快速响应消费者的鉴别需求,有效地应对当前大规模球鞋真伪鉴定挑战。
-
-
-
-
-
-
-
-
-