-
公开(公告)号:CN118797092A
公开(公告)日:2024-10-18
申请号:CN202410946657.0
申请日:2024-07-16
Applicant: 上海交通大学
IPC: G06F16/583 , G06F18/25 , G06F40/30 , G06F18/22 , G06N3/045 , G06F40/126
Abstract: 本发明提供了一种基于文本的行人图像检索模型建立方法、检索方法及系统,包括:获取强正样本对、噪声样本对;获取强正样本对中的图像、文本在单个模态内的图像特征向量及表示、文本特征向量及表示;获取噪声样本中的图像在单个模态内的图像特征向量及表示;获取难样本的掩码文本特征向量;生成图像与文本的跨模态融合特征;生成硬匹配标签;生成噪声矫正匹配标签;生成难样本的掩码标签、单词‑图像匹配标签;利用损失之和L进行训练,L包括特征对比、硬匹配、噪声矫正、掩码建模、单词‑图像匹配损失。本发明矫正了根据身份标签判断图像文本对是否匹配的判定错误情况,提升模型对样本间细微差异的感知能力,提高跨模态检索准确率。
-
公开(公告)号:CN113837262B
公开(公告)日:2023-10-27
申请号:CN202111097831.1
申请日:2021-09-18
Applicant: 上海交通大学
IPC: G06V40/10 , G06V20/52 , G06V10/764 , G06V10/774 , G06V10/82 , G06N3/045 , G06N3/042 , G06N3/0464 , G06N3/048 , G06N3/088
Abstract: 本发明提供了一种无监督行人重识别方法及系统,基于图神经网络,包括:提取行人特征作为节点,根据邻域信息构建图卷积神经网络;利用来自带标签的源域数据的先验损失和来自无标签目标数据的一致性损失对图网络进行约束训练;设计递进的交替更新算法用于基于图网络的聚类模块和行人重识别网络之间的相互促进,从而提升最后的性能。同时还提供了一种相应的终端及介质。本发明具有很好的鲁棒性,能更好地应对距离敏感的传统聚类模块的缺陷,得到更准确的伪标签生成,从而帮助下一步的行人特征学习。
-
公开(公告)号:CN113191301B
公开(公告)日:2023-04-18
申请号:CN202110528792.X
申请日:2021-05-14
Applicant: 上海交通大学
Abstract: 本发明公开一种融合时序和空间信息的视频密集人群计数方法及系统,该方法包括:获取包括密集行人的视频序列,确定所述视频序列中密集人群坐标数据,并转化为密集人群密度图序列;将所述密集人群密度图序列作为预测网络学习目标,采用空间一致性损失函数和时序一致性损失函数,对生成目标进行约束;所述预测网络采用引入3D卷积和分组卷积的预测网络;将需预测的密集人群图像序列输入所述预测网络,输出预测的密度预测图;对所述密度预测图所有像素值进行求和,得到最终的预测人数。本发明较大程度提升了精度,具有良好的鲁棒性,具有较强的应用价值。
-
公开(公告)号:CN114495159A
公开(公告)日:2022-05-13
申请号:CN202210009027.1
申请日:2022-01-06
Applicant: 上海交通大学
Abstract: 本发明提供一种利用自注意力机制构建的社会交互组检测方法,包括:提取交互要素;从所述交互要素提取特征,并模仿自注意力机制进行融合,获取交互强度特征;基于所述交互强度特征,优化网络;利用优化过的网络对图像中交互组进行检测。本发明能够仅从图像信息中实现图像中人与人之间交互强弱的量化,并识别出图像中的社会交互组。
-
公开(公告)号:CN111626102B
公开(公告)日:2022-04-26
申请号:CN202010284322.9
申请日:2020-04-13
Applicant: 上海交通大学
IPC: G06V20/40 , G06V10/30 , G06V10/764 , G06V10/774 , G06K9/62
Abstract: 本发明提供了一种基于视频弱标记的双模态迭代去噪异常检测方法及终端,将弱标记视作精确标签的噪声,分别从图像控件和特征空间进行标签去噪;利用自编码器从图像空间学习正常和异常视频的特性;利用图卷积模型学习视频片段在不同时间上的特征;利用迭代交替更新分类器和去噪器。本发明通过充分考虑视频的弱标记问题,利用去噪模型的方法来克服标记数据的困难,面对异常检测这种数据难以收集的研究领域,有很强鲁棒性,能够很好解决视频的弱标签问题,具有普遍适用性。
-
公开(公告)号:CN113627272A
公开(公告)日:2021-11-09
申请号:CN202110812700.0
申请日:2021-07-19
Applicant: 上海交通大学
Abstract: 本发明公开了一种基于归一网络的严重不对齐行人重识别方法及系统,该方法包括:根据每个输入图像Iw搜集其对应的随机剪裁过的同一身份的不对齐图像Iu;对输入图像Iw、Iu进行处理并获取特征图对输入图像Iw、Iu进行处理并获取姿态图Pw、Pu;利用姿态引导生成器,根据输入特征图与姿态图Pw、Pu生成特征图利用特征图与对姿态引导生成器与姿态引导鉴别器进行训练;对特征图进行处理并获取高阶特征图对高阶特征图进行处理,得到特征向量与基于姿态图Pw、Pu,计算特征向量的可见性;利用分类损失与距离损失作用于所述特征向量与中的可见部分,从而实现对网络训练的监督。本发明方法稳定性强,并为相似性度量生成对齐的特征图,增强了在复杂情境下的鲁棒性。
-
公开(公告)号:CN113627253A
公开(公告)日:2021-11-09
申请号:CN202110766661.5
申请日:2021-07-07
Applicant: 上海交通大学
Abstract: 本发明公开了一种目标重识别方法及装置、计算机设备、计算机可读存储介质。所述方法包括:获取图像集中各目标图像对应的扩展图。基于图神经网络获取各目标图像对应的扩展图的图嵌入向量。基于待识别的目标图像对应的扩展图的图嵌入向量和其他目标图像对应的扩展图的图嵌入向量,确定与待识别目标相同的目标。其中,任一目标图像对应的扩展图至少包括:以该目标为中心的中心节点,以与该目标距离在第一阈值以内的其他目标为邻节点的节点,以各个邻接点为中心,与各邻节点距离在第二阈值以内的其他目标为邻接点的节点,以及由邻节点指向与其对应的中心节点的边。本发明的方案,在一定程度上提高了目标重识别的准确度的同时,也具有较强的鲁棒性。
-
公开(公告)号:CN110378233B
公开(公告)日:2021-03-09
申请号:CN201910536330.5
申请日:2019-06-20
Applicant: 上海交通大学
Abstract: 本发明提供了一种基于人群行为先验知识的双分支行人异常检测方法,包括:利用社会力模型提取视频中人群的交互信息;利用多实例学习方法对视频中不同时间片段学习出异常得分;利用注意力模型捕获视频特征的全局依赖;利用双分支模型将原始视频和其对应的人群交互信息视频结合。本发明充分考虑人类对异常行为判断的先验信息,利用数量充足的正常和异常样本来学习人群行为的正常和异常模式,使得异常检测能在一定地语义层面上对视频中得人群行为进行识别,能很好地解决与适应由于样本数量不足和视频中人群得背景干扰带来的性能损失,更具有鲁棒性;该方法也不需要精确到片段级别的数据标签,即使训练对象是视频的片段,也只需要视频级别的标签。
-
公开(公告)号:CN108537118B
公开(公告)日:2021-03-09
申请号:CN201810184156.8
申请日:2018-03-07
Applicant: 上海交通大学
Abstract: 本发明提供一种基于流体力学三种描述子的行为识别方法,包括:计算图片基于流体力学的三种描述子,分别得到该图片的平流描述子、扩散描述子和压力描述子;将所得到的同一帧的不同描述子的热力图整合成所采用神经网络的输入的数据类型,输入到已经训练好的所述神经网络中,对所述神经网络进行微调得到不同人群行为的模型;通过得到的所述模型对人群行为进行分类,得到所测的人群行为种类,实现行为识别。本发明对于行为识别的准确率较高,可以减少将无事件发生的帧检测为事件发生的帧,同时在也可以检测出更多的事件发生的帧。
-
公开(公告)号:CN111985313A
公开(公告)日:2020-11-24
申请号:CN202010656271.8
申请日:2020-07-09
Applicant: 上海交通大学
Abstract: 本发明提供了一种基于对抗学习的多风格行人重识别方法、系统、终端,包含数据变换和分类识别功能模块,其中图像生成器作为数据空间变换功能模块,将来自不同源的数据转移到模态不变空间中,并消除由多风格行人图片中的模态差距引起的不一致问题。同时利用在分类识别器和模态识别器之间对抗学习来引导表示学习,其中模态识别器在真实图像和虚拟图像之间进行区分从而引导数据的空间变换,以进一步弥合模态差距,分类识别器用于最后的识别分类,从而学习到更具区分度的不变性特征。本发明提取出的特征更具有区分度,更具有鲁棒性,可同时消除模态差距并提高现有特征学习网络的性能,能更好的解决与适应多风格行人图片之间的匹配问题。
-
-
-
-
-
-
-
-
-