-
公开(公告)号:CN116030496A
公开(公告)日:2023-04-28
申请号:CN202310026052.5
申请日:2023-01-09
Applicant: 北京邮电大学
IPC: G06V40/10 , G06V20/40 , G06V10/764 , G06V10/77 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/084
Abstract: 本发明涉及基于多层感知机网络的跨层级加强特征的行人再识别方法,包括如下步骤:1、从含有行人的视频中通过抽帧得到行人图像I;2、从行人图像I中提取特征E1,经过多层感知机网络融合、重塑,得到行人特征F;3、将行人特征F输入嵌入层;4、将嵌入层输出的特征F0输入特征提取网络,得到特征F4,所述特征提取网络包括结构相同的多层子网络、以及加强模块,用于对一层子网络的输出进行加强后输出到跨层的子网络;5、对特征F4进行全尺度融合、归一化与降维处理;6、将处理后的特征输入三元组损失函数进行度量学习,输入交叉熵损失函数进行分类学习,得到训练好的分类器;7、将特征Feat输入到训练好的分类器中,输出行人再识别的分类结果。
-
公开(公告)号:CN113888474A
公开(公告)日:2022-01-04
申请号:CN202111063063.8
申请日:2021-09-10
Applicant: 北京邮电大学
Abstract: 本发明提供了一种目标细胞的智能检测方法。所述方法包括:将超高分辨率免疫组化数字图像均匀地、低重叠地裁剪成多个大尺寸概览图像;将概览图像输入卷积神经网络提取得到不同尺度的特征;将不同尺度的特征进行自适应加权融合,计算出候选细胞的分布概率图;将分布概率图映射到输入的概览图像中,得到多个位置坐标;根据位置坐标信息,对概览图像进行局部裁剪,得到候选细胞的小尺寸近距离图像;将候选细胞的小尺寸近距离图像输入分类网络,输出候选细胞是否为目标细胞的精确分类结果;融合所有概览图像中候选细胞的位置坐标信息和精确分类结果,最后输出目标细胞的检测结果。本发明不仅能更快速地得到检测的结果,还能保证检测的精度。
-
公开(公告)号:CN109800698A
公开(公告)日:2019-05-24
申请号:CN201910026888.9
申请日:2019-01-11
Applicant: 北京邮电大学
Abstract: 本公开涉及一种基于深度学习的图标检测方法,包括模型训练阶段和模型测试阶段,其中,所述模型训练阶段包括以下步骤:步骤1、准备画面中不含待检测图标的视频帧集合;步骤2、准备仅含有待检测图标的图标图像,其包含颜色通道和Alpha通道数据、以及图标分类信息;步骤3、将所述图标图像与视频帧集合中的各个帧进行随机的图像叠加,形成含有待检测图标的叠加图像,作为训练数据集,训练形成图标检测模型;其中,所述模型测试阶段包括以下步骤:步骤4、将待检测图像输入所述图标检测模型,所述图标检测模型输出检测结果,所述检测结果包括所述测试图像是否含有图标、所含图标的分类信息和位置信息。
-
公开(公告)号:CN105844239B
公开(公告)日:2019-03-29
申请号:CN201610168334.9
申请日:2016-03-23
Applicant: 北京邮电大学
Abstract: 本发明公开了一种基于CNN和LSTM的暴恐视频检测方法,属于模式识别、视频检测、深度学习技术领域。所述检测方法首先对待检测视频进行关键帧采样,并提取关键帧特征;然后进行视频层面的表达与判别,包括CNN语义模块的VLAD特征表达与SVM判别、CNN场景模块的场景VLAD特征表达与SVM判别,以及LSTM时序模块的LSTM判别;最后进行结果融合。本发明利用了CNN在图像特征提取和LSTM在时序序列表达方面的优势,并充分考虑暴恐视频在场景方面的特色,实际测试中检测指标mAP值达到98.0%,接近人工作业水准。在运行速度方面,仅采用单机GPU加速的方式,每秒钟便可以处理76.4秒的网络视频,适于阻断暴恐视频在大型视频网站上的传播,有利于维护社会稳定和国家长治久安。
-
公开(公告)号:CN106780440A
公开(公告)日:2017-05-31
申请号:CN201611075728.6
申请日:2016-11-29
Applicant: 北京邮电大学
CPC classification number: G06T7/0004 , G06T2207/30141
Abstract: 本发明公开了一种爆炸电路板残片图像自动比对识别方法,属于模式识别和图像处理技术领域。所述方法首先将残片图像基于概率图模型的图像分割算法进行对象分割,再采用基于概率抽样的颜色模型进行元器件的对象精定位,然后提取特征点并过滤,将过滤后的特征点与检索库中的电路板特征点进行比对识别,确定残片所属的源电路板。本发明首次提出并实现了根据爆炸电路板残片图像自动识别印刷电路板同型号原板的方法。所述比对识别方法能够准确地分割出电路板中的元器件及字符区域,抑制噪声干扰,比对时同时考虑特征点描述与空间几何关系的相似性,该方法在电路板残片图像自动识别中TOP1准确率高于99%。
-
公开(公告)号:CN103942563A
公开(公告)日:2014-07-23
申请号:CN201410125981.2
申请日:2014-03-31
Applicant: 北京邮电大学
IPC: G06K9/62
Abstract: 本申请公开了一种多模态行人再辨识技术,包括以下步骤:步骤1、从第一摄像机和第二摄像机各自拍摄的第一图像和第二图像中分别截取包含目标的前景图像,其中,第二图像对应于已知目标;步骤2、从所截取的前景图像中分别提取颜色特征和纹理特征,并将颜色特征和纹理特征级联,形成图像特征;步骤3、将所述图像特征输入到Hash投影模型,计算第一图像和第二图像中的目标的相似度;步骤4、如果所计算的相似度大于预定阈值,则将第一图像的目标判定为第二图像所对应的已知目标。
-
公开(公告)号:CN119942538A
公开(公告)日:2025-05-06
申请号:CN202510013231.4
申请日:2025-01-06
Applicant: 北京邮电大学
IPC: G06V20/69 , G06V10/764 , G06V10/762 , G06V10/82 , G06N3/084 , G06N3/0895
Abstract: 本发明提供了基于多点标注的病理图像弱监督细胞核分割方法。所述方法包括:准备待标注病理图像数据集;邀请专家标注所有细胞核的中心点、细胞核边界上距离中心点距离的最近点和最远点;根据专家的标注和病理图像细胞核的形状和颜色等先验知识自动生成不同类型的标签(包括但不限于置信度高但不完全标注的标签、完全标注但包含噪声的标签、超像素标签);利用局部一致性和全局一致性的策略训练模型;对待诊断的图像进行预测及后处理获得细胞核分割的结果。该发明适用于多种器官下的多种形态的细胞核分割任务,在细胞核分割领域具有便捷高效、精度高、适用范围广等优点。
-
公开(公告)号:CN119941790A
公开(公告)日:2025-05-06
申请号:CN202510001144.7
申请日:2025-01-02
Applicant: 北京邮电大学
Abstract: 本发明提供了一种基于虚幻引擎的多层次语义交互式跨模态跟踪方法。所述方法包括:使用虚幻引擎5构建虚拟仿真世界;构建行人和车辆虚拟多目标跟踪数据;构造文本‑轨迹匹配对生成多模态跟踪数据;构建逐层融合多模态语义特征的多目标跟踪模型;利用文本特征增强感知查询特征;将解码感知特征利用线性层映射到语义空间,并与编码的文本特征计算相似度;利用感知查询结果更新目标轨迹信息;本发明不仅解决了轨迹语义数据集缺失的问题,还通过逐层语义交互模块结合CLIP的跨模态对齐能力,显著提高了模型在复杂动态环境中的语义目标跟踪的准确性和召回率。
-
公开(公告)号:CN113435234B
公开(公告)日:2024-01-23
申请号:CN202110019216.2
申请日:2021-03-25
Applicant: 北京邮电大学
IPC: G06F18/10 , G06F18/213 , G06F18/25 , A61B5/372 , A61B5/18
Abstract: 本发明提供了一种基于双模态视频EEG数据的驾驶员视觉显著性区域预测方法,所述方法包括:采集驾驶员在执行驾驶行为时的视觉注意力相关的脑电图(Electroencephalography,EEG)信号;对采集EEG信号进行预处理,搭建EEG注意力特征初始化框架,提取二维EEG注意力特征;提取视频图像中的低层特征;将提取的二维EEG注意力特征和提取的视频图像低层特征融合,得到双模态数据;基于双模态数据进行预测。本发明在不使用光流信息的条件下,仅分析视频图像的空间信息就得到了较好的驾驶员的视觉注意力信息(Focus field of driver's Attention,FoA)预测效果,本发明进一步完成了从EEG信号中有效提取车辆驾驶员的视觉注意力特征,并将其与视频图像特征相结合,共同完成目标任务。
-
公开(公告)号:CN117312921A
公开(公告)日:2023-12-29
申请号:CN202311323384.6
申请日:2023-10-12
Applicant: 北京邮电大学
IPC: G06F18/24 , A61B5/318 , G06F18/213 , G06N3/0455 , G06N3/0464 , G06N3/08
Abstract: 本发明提供了一种基于特征距离分布差异损失的心电信号个体体征识别方法。所述方法包括:待训练心电信号片段的数值归一化处理;将心电信号片段与所属用户编号进行关联;在处理完成的心电信号片段中随机选出一组心电信号并记录编号,同时第二组心电信号需要选取与第一组对应位置所属用户相同且不为同一条的信号;利用同一骨干网络对两组信号进行特征提取;计算两组特征间的基于特征距离的分布差异损失,并利用损失不断地优化骨干网络参数;应用时利用训练好的骨干网络分别提取待测心电样本与用户模板样本库中的特征;计算待测心电样本特征与每条用户模板样本特征的特征距离表示;根据计算所得的特征距离预测出待测心电样本所属的用户。
-
-
-
-
-
-
-
-
-