-
公开(公告)号:CN112990058B
公开(公告)日:2023-04-07
申请号:CN202110337734.9
申请日:2021-03-30
Applicant: 北京邮电大学
IPC: G06V20/52 , G06V10/75 , G06V10/774
Abstract: 一种基于轨迹分析的多目标行人徘徊检测方法,涉及智慧城市建设中的城市监控视频分析领域,解决现有行人徘徊检测方法只能对单个行人目标进行分析,无法对出现监控场景中的多目标进行分析,同时存在丢失跟踪目标,以及存在连续几帧目标中心点位置不准确等问题,本发明方法包括步骤一、采用深度学习算法,对检测数据集进行训练和调参,获得行人检测模型;步骤二、实时获取监控场景的视频;步骤三、多目标跟踪;本发明基于运动轨迹方向角的变化范围来进行的徘徊检测,能保证连续多帧未检测到对应目标,仍然能确信跟踪的是相同目标;能够规避目标中心点位置不准确的微小扰动带来的轨迹分析误差,适用于任何轨迹形状;可以自定义折返次数。
-
公开(公告)号:CN115439846A
公开(公告)日:2022-12-06
申请号:CN202210952173.8
申请日:2022-08-09
Applicant: 北京邮电大学
IPC: G06V20/70 , G06V10/26 , G06V10/764 , G06V10/82 , G06V10/762 , G06V10/54 , G06V10/56
Abstract: 本申请公开了一种图像的分割方法、装置、电子设备及介质。通过应用本申请的技术方案,可以利用原始图像的类激活图像来确定其每个特征区域图像的所属类别,并将其中特定类别的特征区域图像映射到原始图像中从而得到保留有分割对象的完整边界的分割图像。进而实现一种利用超像素技术保留目标区域的边界,并同时结合采用计算目标区域原型的方法尽可能获得图像完整的伪像素级标签。从而避免了相关技术中存在的,由于类激活图存在产生的伪像素级标签目标区域不完成或边界不明显所导致的,分割后的图像不够精确的问题。
-
公开(公告)号:CN112200093B
公开(公告)日:2022-08-30
申请号:CN202011091366.6
申请日:2020-10-13
Applicant: 北京邮电大学
Abstract: 本发明涉及一种基于不确定性估计的行人再识别方法,属于行人再识别技术领域,包括步骤:获取待识别的原始图像序列,原始图像序列中的每一帧原始图像均包含同一行人;将原始图像序列输入至利用基于不确定性估计的行人再识别模型训练方法训练得到的行人再识别模型中,计算输出集合;使用不确定性估计集合对输出集合进行排序,选择不确定性估计最高的Δ个输出的标号,获得标号集合和选定输出集合;将选定输出集合中的所有输出与数据库中的样本计算距离,并分别匹配出距离最小的图像作为行人再识别的检索结果。本发明能够同时抑制输入图像中的区域噪声和随机噪声,降低噪声对于行人再识别模型性能的影响,提高模型的稳定性,提升行人再识别的准确率。
-
公开(公告)号:CN114186568A
公开(公告)日:2022-03-15
申请号:CN202111541714.X
申请日:2021-12-16
Applicant: 北京邮电大学
Abstract: 本发明公开了一种基于关系编码和层次注意力机制的图像段落描述方法,方法模型由关系编码模块和层次注意解码模块组成。关系编码模块通过两个编码器捕获编码空间关系信息和语义关系信息,其中语义关系编码时通过训练有监督的语义分类器来学习语义关系的先验知识。层次注意解码模块的层次注意力使用带有关系门和视觉门的层次注意力来动态的融合关系信息和物体区域特征,关系门用于在空间关系信息和语义关系信息之间切换,视觉门用于决定是否嵌入使用视觉信息,模型采用从粗粒度区域到细粒度的空间和语义关系的策略在段落生成过程中融合视觉信息。通过在斯坦福段落描述数据集上的大量实验表明,本发明方法在本领域的多个评价指标上显著优于现有方法。
-
公开(公告)号:CN109948721B
公开(公告)日:2021-07-09
申请号:CN201910238135.4
申请日:2019-03-27
Applicant: 北京邮电大学
Abstract: 本发明公开了一种基于视频描述的视频场景分类方法,包括:基于DCT变换以及帧滑动窗口快速提取视频关键帧,并对视频关键帧进行划分;采用3d卷积神经网络对视频不定长关键帧序列进行特征提取;通过Sent2Vec方式获取每个视频描述的嵌入表示作为视频的语义表示;基于提取的特征和语义表示得到最终模型架构三维卷积循环神经网络。本发明借助于视频描述,实现一种快速、准确的视频场景分类方法,该方法可快速准确地提取视频关键帧,相比使用视频所有的帧或者按照一定时间间隔抽样,结果更加准确快速。同时可提升视频场景分类的准确性,通过长短期记忆神经网络训练学习视频的关键帧时序关系,更符合视频这一流媒体的性质。可处理任意长度视频关键帧序列。
-
公开(公告)号:CN112990058A
公开(公告)日:2021-06-18
申请号:CN202110337734.9
申请日:2021-03-30
Applicant: 北京邮电大学
Abstract: 一种基于轨迹分析的多目标行人徘徊检测方法,涉及智慧城市建设中的城市监控视频分析领域,解决现有行人徘徊检测方法只能对单个行人目标进行分析,无法对出现监控场景中的多目标进行分析,同时存在丢失跟踪目标,以及存在连续几帧目标中心点位置不准确等问题,本发明方法包括步骤一、采用深度学习算法,对检测数据集进行训练和调参,获得行人检测模型;步骤二、实时获取监控场景的视频;步骤三、多目标跟踪;本发明基于运动轨迹方向角的变化范围来进行的徘徊检测,能保证连续多帧未检测到对应目标,仍然能确信跟踪的是相同目标;能够规避目标中心点位置不准确的微小扰动带来的轨迹分析误差,适用于任何轨迹形状;可以自定义折返次数。
-
公开(公告)号:CN110458867B
公开(公告)日:2020-07-24
申请号:CN201910753716.1
申请日:2019-08-15
Applicant: 北京邮电大学
Abstract: 本发明一种基于注意力循环网络的目标跟踪方法,通过在目标跟踪框架中引入局部位置注意力机制以及外观注意力机制,设立三个深度模型,并采用循环卷积神经网络进行时序预测,在跟踪框架中加入不确定度评估机制等技术手段,大大提高了基于计算机算法的视觉目标跟踪的效率和准确度,具有较高的可靠性和可推广价值,相较于其他的时序预测方法,参数量少,速度快,准确度较高;在跟踪过程中使用了不确定度评估机制,能够保证跟踪结果的质量,并在质量下降时及时初始化跟踪器或停止跟踪,避免给出过多错误的结果,具有更高的可靠性。
-
公开(公告)号:CN110458867A
公开(公告)日:2019-11-15
申请号:CN201910753716.1
申请日:2019-08-15
Applicant: 北京邮电大学
Abstract: 本发明一种基于注意力循环网络的目标跟踪方法,通过在目标跟踪框架中引入局部位置注意力机制以及外观注意力机制,设立三个深度模型,并采用循环卷积神经网络进行时序预测,在跟踪框架中加入不确定度评估机制等技术手段,大大提高了基于计算机算法的视觉目标跟踪的效率和准确度,具有较高的可靠性和可推广价值,相较于其他的时序预测方法,参数量少,速度快,准确度较高;在跟踪过程中使用了不确定度评估机制,能够保证跟踪结果的质量,并在质量下降时及时初始化跟踪器或停止跟踪,避免给出过多错误的结果,具有更高的可靠性。
-
公开(公告)号:CN108596237B
公开(公告)日:2019-11-15
申请号:CN201810351707.5
申请日:2018-04-19
Applicant: 北京邮电大学 , 中国人民解放军第三O七医院
Abstract: 本发明提供了一种基于颜色和血管的LCI激光内镜下的结肠息肉分类装置,通过提取LCI激光内镜下的结肠息肉图片的颜色特征向量;将腺瘤性结肠息肉内镜图片集的颜色特征向量作为训练样本进行训练,得到第一高斯混合模型;将非腺瘤性结肠息肉内镜图片集的颜色特征向量作为训练样本进行训练,得到第二高斯混合模型;提取未知类型的结肠息肉图片的颜色特征向量和血管密度特征值;将提取的颜色特征向量分别输入第一高斯混合模型和第二高斯混合模型得到结果值,得出分类结果的技术方案,本发明基于LCI激光内镜,提取颜色和血管密度作为特征向量为结肠息肉分类,该方法所需样本的数量小,训练任务简单,计算量小,在实时监测中无需为此搭设服务器,降低成本。
-
公开(公告)号:CN109902699A
公开(公告)日:2019-06-18
申请号:CN201711298332.2
申请日:2017-12-08
Applicant: 北京邮电大学 , 深圳市腾讯计算机系统有限公司
Abstract: 本发明实施例公开了一种信息处理方法、装置和计算机存储介质,所述方法包括:获得第一图像信息,获取所述第一图像信息包括的第一图像数据和对应的第一标注词;提取所述第一图像数据的词袋特征和深度卷积网络特征,提取所述第一标注词的词袋特征;基于所述第一图像数据的词袋特征、深度卷积网络特征以及所述第一标注词的词袋特征建立图像标注模型。
-
-
-
-
-
-
-
-
-