-
公开(公告)号:CN113642392B
公开(公告)日:2023-11-28
申请号:CN202110767455.6
申请日:2021-07-07
Applicant: 上海交通大学
Abstract: 本发明公开了一种目标搜索方法及装置。所述方法包括:获取目标视频帧中各目标的特征表达,基于各目标的特征表达,构建以待搜索目标为中心节点,其他目标为上下文节点且由上下文节点指向中心节点的源图。获取候选视频帧中各候选目标的特征表达,基于各候选目标的特征表达和各目标的特征表达,确定与各目标对应的候选目标,构建以与待搜索目标对应的候选目标为中心节点,与其他目标对应的候选目标为上下文节点且由上下文节点指向中心节点的目标图。基于孪生残差图卷积神经网络获得源图和目标图的图嵌入向量。至少基于源图的图嵌入向量和目标图的图嵌入向量确定候选视频帧中的待搜索目标。本发明的方案,提高了目标搜索的准确度且具有较强的鲁棒性。
-
公开(公告)号:CN113627253B
公开(公告)日:2023-10-27
申请号:CN202110766661.5
申请日:2021-07-07
Applicant: 上海交通大学
IPC: G06V40/10 , G06V10/82 , G06N3/042 , G06N3/0464 , G06N3/082
Abstract: 本发明公开了一种目标重识别方法及装置、计算机设备、计算机可读存储介质。所述方法包括:获取图像集中各目标图像对应的扩展图。基于图神经网络获取各目标图像对应的扩展图的图嵌入向量。基于待识别的目标图像对应的扩展图的图嵌入向量和其他目标图像对应的扩展图的图嵌入向量,确定与待识别目标相同的目标。其中,任一目标图像对应的扩展图至少包括:以该目标为中心的中心节点,以与该目标距离在第一阈值以内的其他目标为邻节点的节点,以各个邻接点为中心,与各邻节点距离在第二阈值以内的其他目标为邻接点的节点,以及由邻节点指向与其对应的中心节点的边。本发明的方案,在一定程度上提高了目标重识别的准确度的同时,也具有较强的鲁棒性。
-
公开(公告)号:CN111738074B
公开(公告)日:2023-07-25
申请号:CN202010417405.0
申请日:2020-05-18
Applicant: 上海交通大学
IPC: G06V40/10 , G06V40/20 , G06V20/52 , G06V10/774 , G06V10/778 , G06V10/80
Abstract: 本发明提供了一种基于弱监督学习的行人属性识别方法、系统及装置,包括:采用深度卷积神经网络提取目标行人不同层次的视觉特征;通过弱监督学习的方法在隐含属性空间学习隐含属性,同时获得隐含特征对应的空间约束,得到对应的隐含属性空间位置图;根据目标行人不同层次的视觉特征和对应的隐含属性空间位置图,对目标行人的局部特征提取,得到目标行人不同层次的局部特征;通过自注意力的方法对行人属性间关系进行建模,利用全局平均池化层和全连接层作为分类器,得到不同层次下对目标行人属性的预测值;对每个属性投票得到最终识别结果。本发明将属性空间约束和属性间约束联合起来预测目标行人属性,提升了行人属性识别的性能。
-
公开(公告)号:CN115731599A
公开(公告)日:2023-03-03
申请号:CN202211540806.0
申请日:2022-12-02
Applicant: 上海交通大学
IPC: G06V40/16 , G06V10/774
Abstract: 本发明提供一种基于学习排序的人脸图像质量评价的方法和系统,包括:构造人脸数据集中每个身份对应的的类中心;构造人脸图像样本在潜在空间内的标准化类内距离和标准化类间距离,并利用他它们构造人脸图像样本的质量标签;构造人脸图像质量网络Q;构造人脸图像对 以及 质量高于 的实际概率和后验概率;利用实际概率和后验概率,构造交叉熵损失函数;基于交叉熵损失函数训练人脸图像质量网络。能减小现有人脸图像质量评价方法中存在的偏差因素,从而提升质量评价的性能,得到与识别结果更加一致的人脸图像质量分数。易于重现且具有很好地适用性和推广性。
-
公开(公告)号:CN115359294A
公开(公告)日:2022-11-18
申请号:CN202211012661.7
申请日:2022-08-23
Applicant: 上海交通大学
IPC: G06V10/764 , G06V10/82 , G06V10/774 , G06V10/74 , G06V10/40 , G06N3/04 , G06N3/08
Abstract: 本发明提供一种基于相似性正则化类内挖掘的跨粒度小样本学习方法,包括:利用图像特征提取网络生成训练图像样本特征;实施第一优化环,利用弱监督对深度学习模型的粗粒度类别间语义辨识性进行约束;实施第二优化环,通过对称的特征嵌入器和非对称的特征预测器,实现粗粒度类别内部的相似性正则化;将第一优化环与第二优化环损失相加,对整个网络结构进行端到端的误差反向传播,对网络参数进行优化;利用场景式微调使得到的图像特征提取网络适应小样本分类任务,最终得到细粒度小样本分类模型。本发明联合并改进弱监督和自监督两种学习范式的协同优化,同时考虑粗粒度类别的类内和类间辨识性,能得到更具有细粒度辨识能力的小样本分类模型。
-
公开(公告)号:CN113191301A
公开(公告)日:2021-07-30
申请号:CN202110528792.X
申请日:2021-05-14
Applicant: 上海交通大学
Abstract: 本发明公开一种融合时序和空间信息的视频密集人群计数方法及系统,该方法包括:获取包括密集行人的视频序列,确定所述视频序列中密集人群坐标数据,并转化为密集人群密度图序列;将所述密集人群密度图序列作为预测网络学习目标,采用空间一致性损失函数和时序一致性损失函数,对生成目标进行约束;所述预测网络采用引入3D卷积和分组卷积的预测网络;将需预测的密集人群图像序列输入所述预测网络,输出预测的密度预测图;对所述密度预测图所有像素值进行求和,得到最终的预测人数。本发明较大程度提升了精度,具有良好的鲁棒性,具有较强的应用价值。
-
公开(公告)号:CN111738074A
公开(公告)日:2020-10-02
申请号:CN202010417405.0
申请日:2020-05-18
Applicant: 上海交通大学
Abstract: 本发明提供了一种基于弱监督学习的行人属性识别方法、系统及装置,包括:采用深度卷积神经网络提取目标行人不同层次的视觉特征;通过弱监督学习的方法在隐含属性空间学习隐含属性,同时获得隐含特征对应的空间约束,得到对应的隐含属性空间位置图;根据目标行人不同层次的视觉特征和对应的隐含属性空间位置图,对目标行人的局部特征提取,得到目标行人不同层次的局部特征;通过自注意力的方法对行人属性间关系进行建模,利用全局平均池化层和全连接层作为分类器,得到不同层次下对目标行人属性的预测值;对每个属性投票得到最终识别结果。本发明将属性空间约束和属性间约束联合起来预测目标行人属性,提升了行人属性识别的性能。
-
公开(公告)号:CN107220611B
公开(公告)日:2020-02-11
申请号:CN201710370428.9
申请日:2017-05-23
Applicant: 上海交通大学
Abstract: 本发明公开一种基于深度神经网络的行人空时特征提取方法,步骤为:在一个深度网络中利用卷积神经网络(CNN)提取行人的空域特征,利用递归神经网络(RNN)综合提取出的空域特征从而得到行人的时域特征;在网络中设计叠加层融合CNN和RNN提取出的空域和时域特征,得到行人的空时特征表达;分别在行人的全局图片和局部图片进行网络训练得到相应的具有互补性质的全局特征和局部特征,加之进行融合,得到最终的特征表达。本发明具有很好的鲁棒性,能更好的解决与适应遮挡和光线变化等复杂情况;结合了行人的局部和全局特征,挖掘行人的细节特性,使其在下一步的行人识别中发挥更好的性能及效率。
-
公开(公告)号:CN110765879A
公开(公告)日:2020-02-07
申请号:CN201910903023.6
申请日:2019-09-24
Applicant: 上海交通大学 , 中国电子科技集团公司电子科学研究院
Abstract: 本发明提供了一种基于B/S架构的实时视频分析系统,Web前端模块接收用户输入指令、将用户输入指令发送至调度服务器模块、向调度服务器模块调取分析结果以及呈现分析结果;调度服务器模块根据用户输入指令启动主分析模块、将用户输入指令发送至指令转发模块以及接收分析结果并暂存;指令转发模块对用户输入指令进行解析并转发至主分析模块;主分析模块根据用户输入指令对实时视频进行分析,并将分析结果发送至调度服务器模块。本发明同时提供了一种基于B/S架构的实时视频分析方法。本发明保证高压力下取帧速度不受影响,模块间通信效率相比传统方式较高,通信错误率降低,且保证了高压力下服务器端播放进度依然与前端对齐。
-
公开(公告)号:CN106445985B
公开(公告)日:2019-09-03
申请号:CN201610283654.9
申请日:2016-04-29
Applicant: 上海交通大学
IPC: G06F16/78 , G06F16/783 , G06F16/735
Abstract: 本发明公开了一种基于手绘运动轮廓的视频检索方法及系统,所述方法步骤:在构建视频索引数据库阶段,首先对视频片段的光流场进行运动分解得到具有典型运动结构的子运动矢量场;利用运动结构编码算法对每个子运动矢量场提取运动描述子;将每个子运动矢量场的描述子及相关ID信息存入索引数据库;在视频检索阶段,首先对用户的手绘运动轮廓进行矢量化,得到运动矢量场;然后利用运动结构编码算法对该矢量场提取运动特征;最后对索引数据库进行排序,得到检索结果。本发明可以有效地对视频进行运动层面的索引标注以及基于手绘运动轮廓的检索,具有很好的跨场景适应性,在大规模监控视频的索引和浏览方面具有重要的应用价值。
-
-
-
-
-
-
-
-
-