-
公开(公告)号:CN105205458A
公开(公告)日:2015-12-30
申请号:CN201510591113.8
申请日:2015-09-16
Applicant: 北京邮电大学
IPC: G06K9/00
CPC classification number: G06K9/00288 , G06K9/00906
Abstract: 本发明提供一种人脸活体检测方法、装置及系统,其中,该方法,包括:获取主摄像设备采集的第一图像和副摄像设备采集的第二图像,并当第一图像中包含人脸图像的特征信息时,对第一图像进行校正处理,以及对校正后的第一图像和第二图像进行立体匹配处理,得到人脸图像距离主摄像设备的视差图,进而根据该视差图和主摄像设备与副摄像设备之间的立体关系矩阵,拟合得出该人脸图像关键点的拟合平面,从而计算出对应的拟合偏差;将该拟合偏差与设定阈值进行比较,进而判断出该人脸图像是否来自活体人脸。本发明的技术方案,操作简单、抗外界干扰的能力强、精度高,避免了机器学习方法中的模型训练部分。
-
公开(公告)号:CN104978549A
公开(公告)日:2015-10-14
申请号:CN201410133560.4
申请日:2014-04-03
Applicant: 北京邮电大学 , 腾讯科技(深圳)有限公司
CPC classification number: G06K9/00281 , G06K9/00268 , G06K9/00302 , G06K9/4604 , G06K9/4671 , G06K9/52 , G06K2009/4666 , G06T7/11 , G06T7/13 , G06T7/60 , G06T17/00 , G06T2200/04 , G06T2207/20112 , G06T2207/30201
Abstract: 本发明提供了一种三维人脸图像特征提取方法,所述方法包括:人脸区域分割,得到一组人脸区域;将每个人脸区域投射到对应的区域边界球;根据所述区域边界球获取对应的人脸区域的表示,记为所述人脸区域的区域边界球描述子;对每个人脸区域计算所述人脸区域的区域边界球描述子的权重;根据所述人脸区域的表示和对应的所述权重获取三维人脸图像的特征。采用该方法,能够使得提取出的三维人脸图像的特征同时满足于人脸识别和情感分析。此外,还提供了一种三维人脸图像特征提取系统。
-
公开(公告)号:CN115100090B
公开(公告)日:2025-04-25
申请号:CN202210646212.1
申请日:2022-06-09
Applicant: 北京邮电大学
Abstract: 本发明提供了一种基于时空注意的单目图像深度估计系统。包括:时空学习模块接收输入的单目图像序列,学习单目图像序列中的时空特征;时空增强模块对时空特征序列进行池化操作获得融合特征,对融合特征执行自注意力操作,得到空间增强后的时空特征;采用卷积操作分别对相邻视图的时空特征进行压缩,采用迭代选择的方式在不同特征图之间执行互注意力操作,得到时序关联特征。时空解码模块对空间增强后的时空特征和时序关联特征进行上采样,输出与图像深度大小相同的深度图。本发明系统不仅对单目视频中空间结构信息和时序关联信息的关注与学习,而且增强了网络对时空特征的映射和表达能力,重建了与输入图像序列的时空特征保持一致的单目深度图。
-
公开(公告)号:CN118968609A
公开(公告)日:2024-11-15
申请号:CN202410818306.1
申请日:2024-06-24
Applicant: 北京邮电大学
IPC: G06V40/20 , G06V20/40 , G06V10/764 , G06T3/4053 , G06F17/18 , G06V10/74 , G06N3/0455 , G06N3/049 , G06N3/0464 , G06N3/08
Abstract: 本发明提供了一种基于关键帧选择的多路径网络的人体行为识别方法。该方法包括:对待识别的视频数据进行采样,得到多个视频分段;对各个视频分段进行特征采集,使用多层感知器和归一化函数生成概率分布,根据概率分布筛选出人体动作所在的视频分段;将所述人体动作所在的视频分段输入到多路径视频‑文本编码器分类网络中,通过时间编码器和空间编码器从视频分段学习时空特征,通过文本编码器学习视频分段中的文本特征,通过计算时空特征和文本特征的相似度,获得所述待识别视频的人体行为的识别结果。本发明所提出的方法能够有效地筛选出与人体动作相关的图像帧,减少无关行为的干扰,提升整体的识别效果。
-
公开(公告)号:CN116959100A
公开(公告)日:2023-10-27
申请号:CN202310732026.4
申请日:2023-06-20
Applicant: 北京邮电大学
IPC: G06V40/20 , G06V20/40 , G06V10/774 , G06V10/82
Abstract: 本发明提供了一种基于频域增强的压缩视频人体行为识别方法。该方法包括:构建频域增强FE模块,所述FE模块包括时间‑通道双头注意力TCTHA模块和频段重叠的分组卷积FOGC模块;将所述FE模块插入到骨干网络为ResNet‑50的网络中,得到频域增强的压缩视频人体行为识别FENet网络,对所述FENet网络进行训练;将待识别的压缩视频数据输入到训练好的FENet网络中,FENet网络输出所述待识别的压缩视频的人体行为识别结果。本发明方法解决了频域学习的低频纹理和边缘线索丢失问题、时空建模不足的问题,与其他基于频域数据的方法相比,达到了更高的识别准确率,与其他基于压缩域数据的方法和基于RGB数据方法相比,也达到了具有竞争力的准确率,同时具有较高的效率。
-
公开(公告)号:CN116823908A
公开(公告)日:2023-09-29
申请号:CN202310758435.1
申请日:2023-06-26
Applicant: 北京邮电大学
IPC: G06T7/50 , G06T9/00 , G06V10/52 , G06V10/80 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/08
Abstract: 本发明提供了一种基于多尺度特征相关性增强的单目图像深度估计方法。该方法包括:利用多模态RGB‑Depth融合模块对输入的RGB图像进行数据增强的预处理操作;使用多尺度深度编码模块提取数据增强后的多尺度特征图;在解码阶段使用RFF模块获取细粒度特征图,使用MFCE模块增强多尺度特征中的不同尺度间特征的相关性,通过结合RFF模块和MFCE模块融合和优化特征图,并获得逐像素深度图;通过深度表征目标函数优化整个单目深度估计网络模型的训练,确保泛化能力。本发明方法增强全局特征与局部特征之间的相关性,学习有效的外观结构信息,解决了由纹理偏差导致对外观结构错误估计的问题,重建了清晰稠密的单目深度图。
-
公开(公告)号:CN115131797B
公开(公告)日:2023-06-09
申请号:CN202210742861.1
申请日:2022-06-28
Applicant: 北京邮电大学
Abstract: 本发明提供了一种基于特征增强金字塔网络的场景文本检测方法。该方法包括:将待检测图像输入到特征增强金字塔网络,特征增强金字塔网络对待检测图像经过不同的卷积阶段生成不同尺度的特征图,将不同尺度的特征图进行拼接得到富含尺度信息的高级特征图;将高级特征图输入到通道注意力机制模块中,输出经过权重选择的各个通道权重不同的特征图;将经过权重选择的各个通道权重不同的特征图输入到后处理模块,后处理模块输出待检测图像的文本检测结果。本发明使用Res2Net与特征增强金字塔网络作为骨架网络,在特征金字塔网络的基础上新增下采样路径,只对邻近层进行采样后融合,使用通道注意力机制增强文本特征的权重,使算法检测到更加精确的文本边界。
-
公开(公告)号:CN115100709B
公开(公告)日:2023-05-23
申请号:CN202210718470.6
申请日:2022-06-23
Applicant: 北京邮电大学
IPC: G06V40/16 , G06V10/82 , G06V10/774 , G06N3/0464
Abstract: 本发明提供了一种特征分离的图像人脸识别与年龄估计方法。该方法包括:将待识别的人脸图像输入到多任务框架中,将人脸图像转化为人脸特征,将人脸特征输入到所述特征分离网络中,通过特征分离网络分离所述人脸特征中的身份特征和年龄特征;将身份特征进行特征铺平生成描述当前图像身份的嵌入特征向量,通过度量所述嵌入特征向量与各个标准身份向量之间的距离值,确定所述待识别的人脸图像对应的身份信息;通过线性层将年龄特征映射为一组向量,将所述一组向量的取值加在一起,获取所述待识别的人脸图像对应的年龄信息。本发明方法通过注意力机制的特征分离方法,有效地分离出适合各个子任务的有效特征,提升了各个子任务的特征鲁棒性。
-
公开(公告)号:CN115131797A
公开(公告)日:2022-09-30
申请号:CN202210742861.1
申请日:2022-06-28
Applicant: 北京邮电大学
Abstract: 本发明提供了一种基于特征增强金字塔网络的场景文本检测方法。该方法包括:将待检测图像输入到特征增强金字塔网络,特征增强金字塔网络对待检测图像经过不同的卷积阶段生成不同尺度的特征图,将不同尺度的特征图进行拼接得到富含尺度信息的高级特征图;将高级特征图输入到通道注意力机制模块中,输出经过权重选择的各个通道权重不同的特征图;将经过权重选择的各个通道权重不同的特征图输入到后处理模块,后处理模块输出待检测图像的文本检测结果。本发明使用Res2Net与特征增强金字塔网络作为骨架网络,在特征金字塔网络的基础上新增下采样路径,只对邻近层进行采样后融合,使用通道注意力机制增强文本特征的权重,使算法检测到更加精确的文本边界。
-
公开(公告)号:CN115100709A
公开(公告)日:2022-09-23
申请号:CN202210718470.6
申请日:2022-06-23
Applicant: 北京邮电大学
IPC: G06V40/16 , G06V10/82 , G06V10/774 , G06N3/04
Abstract: 本发明提供了一种特征分离的图像人脸识别与年龄估计方法。该方法包括:将待识别的人脸图像输入到多任务框架中,将人脸图像转化为人脸特征,将人脸特征输入到所述特征分离网络中,通过特征分离网络分离所述人脸特征中的身份特征和年龄特征;将身份特征进行特征铺平生成描述当前图像身份的嵌入特征向量,通过度量所述嵌入特征向量与各个标准身份向量之间的距离值,确定所述待识别的人脸图像对应的身份信息;通过线性层将年龄特征映射为一组向量,将所述一组向量的取值加在一起,获取所述待识别的人脸图像对应的年龄信息。本发明方法通过注意力机制的特征分离方法,有效地分离出适合各个子任务的有效特征,提升了各个子任务的特征鲁棒性。
-
-
-
-
-
-
-
-
-