-
公开(公告)号:CN119863823A
公开(公告)日:2025-04-22
申请号:CN202510061803.6
申请日:2025-01-15
Applicant: 大连理工大学
IPC: G06V40/10 , G06V10/143 , G06V10/74 , G06V10/764 , G06V10/774 , G06V10/82 , G06V10/80 , G06N3/042 , G06N3/0442 , G06N3/045 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于超图驱动软语义动态学习的可见光‑红外行人重识别方法,步骤如下:将行人图像划分为训练集和测试集,并进行数据增强;利用自注意力机制提取行人层次化软语义特征;利用门控机制进行通道和空间方向的跨阶段特征融合;计算模态对齐损失,缩小可见光与红外特征的差异;利用超图神经网络动态地探索所提取的软语义之间的关系;使用联合损失训练网络直至收敛;测试集行人重识别。通过使用本发明不仅有效地捕捉并动态地融合层次化的软语义特征,提取模态不变的特征,弥合可见光与红外模态之间的差距,还能自适应地探索语义之间的高阶关系,有效地学习模态不变语义,减少模态间的差异,显著提高可见光‑红外行人重识别的效果。
-
公开(公告)号:CN116524596A
公开(公告)日:2023-08-01
申请号:CN202310507915.0
申请日:2023-05-08
Applicant: 大连理工大学
IPC: G06V40/20 , G06V20/40 , G06V10/40 , G06V10/62 , G06V10/764 , G06V10/80 , G06V10/82 , G06N3/045 , G06N3/0464 , G06N3/08
Abstract: 本发明属于计算机视觉与视频动作识别领域,公开了一种基于动作粒度分组结构的体育视频动作识别方法,提出了一种基于动作粒度的层次化分组结构,设计了一种轻量级的多尺度时空建模与信息融合机制。步骤如下:视频抽帧,分段随机帧采样,视频帧预处理,选取骨干网络,在骨干网络中插入动作粒度分组模块实现多尺度时空特征聚合,使用全连接层和softmax层进行类别预测,使用交叉熵损失对动作类别进行训练,训练及验证。通过使用本发明可有效的提取多粒度动作信息,适用于包含多层次类别的体育视频动作识别,并显著提高体育视频动作识别的精度。本发明作为一种基于动作粒度分组结构的体育视频动作识别方法,可广泛应用于体育视频动作识别领域。
-
公开(公告)号:CN114187655A
公开(公告)日:2022-03-15
申请号:CN202111430274.0
申请日:2021-11-29
Applicant: 大连理工大学
IPC: G06V40/20 , G06V40/10 , G06V10/774 , G06V10/762 , G06V10/74 , G06T7/66 , G06N3/08 , G06V10/82 , G06K9/62
Abstract: 本发明属于人工智能与行人重识别领域,公开了一种基于联合训练策略的无监督行人重识别方法。针对摄像机间域间隙较大的问题,提出了一种摄像机间不变性特征学习方法,旨在让模型学习到可以区分不同摄像机下的不变性特征的能力。包括以下步骤:行人图像特征提取;聚类并分配伪标签;计算行人质心和摄像机质心;挖掘边缘特征和摄像机间不变性特征;行人实例特征和摄像机质心的更新;利用对比损失更新模型的参数。通过使用本发明可以有效的减少标签噪声,降低了摄像机间域间隙,并显著提高行人重识别的精度。本发明作为一种基于联合训练策略的无监督行人重识别方法,可广泛应用于行人重识别领域。
-
公开(公告)号:CN114187655B
公开(公告)日:2024-08-13
申请号:CN202111430274.0
申请日:2021-11-29
Applicant: 大连理工大学
IPC: G06V40/20 , G06V40/10 , G06V10/774 , G06V10/762 , G06V10/74 , G06T7/66 , G06N3/088 , G06V10/82
Abstract: 本发明属于人工智能与行人重识别领域,公开了一种基于联合训练策略的无监督行人重识别方法。针对摄像机间域间隙较大的问题,提出了一种摄像机间不变性特征学习方法,旨在让模型学习到可以区分不同摄像机下的不变性特征的能力。包括以下步骤:行人图像特征提取;聚类并分配伪标签;计算行人质心和摄像机质心;挖掘边缘特征和摄像机间不变性特征;行人实例特征和摄像机质心的更新;利用对比损失更新模型的参数。通过使用本发明可以有效的减少标签噪声,降低了摄像机间域间隙,并显著提高行人重识别的精度。本发明作为一种基于联合训练策略的无监督行人重识别方法,可广泛应用于行人重识别领域。
-
公开(公告)号:CN116797966A
公开(公告)日:2023-09-22
申请号:CN202310516184.6
申请日:2023-05-09
Applicant: 大连理工大学
IPC: G06V20/40 , G06V40/10 , G06V10/40 , G06V10/82 , G06V10/80 , G06V10/764 , G06V10/774 , G06N3/0464 , G06N3/08 , G06N3/048 , G06N3/047
Abstract: 本发明属于人工智能与视频行人重识别领域,公开一种基于注意力时空图网络的视频行人重识别方法,提出一种多粒度注意力时空图网络方法,旨在不破坏行人身体结构的同时关注前景信息,减少背景干扰,融合多粒度时态信息,同时抑制异常帧的特征表达。步骤如下:提取行人原始帧级特征;提取各帧级行人关键区域信息;提取全局分支特征;多粒度空间注意力图网络更新帧级特征;多粒度时间注意力图网络获取行人视频序列级特征;损失函数训练网络。通过使用本发明可减少破坏身体结构,降低背景噪声的干扰,并抑制异常帧信息表达,显著提升视频行人重识别的性能。本发明作为一种基于注意力时空图网络的视频行人重识别方法,可广泛应用于视频行人重识别领域。
-
-
-
-