-
公开(公告)号:CN116630837B
公开(公告)日:2025-02-11
申请号:CN202310260849.1
申请日:2023-03-13
Applicant: 北京邮电大学
IPC: G06V20/40 , G06V10/774 , G06V10/82 , G06N3/08 , G06N3/0464
Abstract: 本申请提供一种双阶段视频去噪模型训练方法、视频去噪方法和系统,方法包括:采用各个噪声视频样本各自的无噪声视频数据以及各个图像帧组,对残差自注意力模型进行模型训练,使得残差自注意力模型先在第一阶段提取各个图像帧组中的主图像帧的动态特征以得到第一阶段去噪结果,再于第二阶段基于各个第一阶段去噪结果分别提取各个主图像帧的静态特征以得到第二阶段去噪结果,进而生成用于对视频去噪的双阶段视频去噪模型。本申请能够从两个阶段分别针对时间和空间两个维度的不同特点进行动态特征和静态特征的提取,能够有效提高训练得到的视频去噪模型的性能,进而能够有效提高双阶段视频去噪模型输出的视频去噪结果的鲁棒性、显著性及可靠性。
-
公开(公告)号:CN119337074A
公开(公告)日:2025-01-21
申请号:CN202411894324.4
申请日:2024-12-20
Applicant: 北京邮电大学
IPC: G06F18/15 , G06F18/213 , G06F18/25 , G06N3/0442 , G06N3/0455 , G06N3/0464
Abstract: 本发明提供一种基于条件扩散的不完全多模态感知数据恢复方法及系统,该方法的步骤包括:实时感知多个模态的数据的接收情况,判定是否存在至少一个模态的数据的缺失;基于缺失数据的模态的历史数据构建高斯过程,基于所述高斯过程构建条件分布,从条件分布中进行采样,得到时间相关性矩阵;判定缺失数据的模态缺失数据的时间段,从未缺失数据的模态中获取对应时间段的数据,构建每个对应每个未缺失数据的模态的特征矩阵,对多个模态的特征矩阵进行融合,得到语义一致性矩阵;将条件分布的数据、时间相关性矩阵和语义一致性矩阵输入到预设置的特征恢复模型中,所述特征恢复模型输出对应缺失数据的模态的缺失数据的恢复特征矩阵。
-
公开(公告)号:CN118644872A
公开(公告)日:2024-09-13
申请号:CN202410469377.5
申请日:2024-04-18
Applicant: 北京邮电大学
IPC: G06V40/10 , G06V10/764 , G06V10/82 , G06V20/52 , G06V10/80 , G06V10/52 , G06V10/44 , G06N3/0464 , G06N3/096 , G06N3/09
Abstract: 本申请提供的一种图像识别方法、装置、电子设备及存储介质,包括:获取待检测图像;将待检测图像输入到训练好的双视角特征提取模型中,以确定第一特征向量;其中,双视角特征提取模型至少包括卷积神经网络骨干、基于注意力机制的全局特征提取网络分支、基于分区法的局部特征提取网络分支及融合单元;将第一特征向量与预设图像集中至少一个图像的第二特征向量进行相似度比较,根据比较结果确定待检测图像的识别结果。
-
公开(公告)号:CN117894072A
公开(公告)日:2024-04-16
申请号:CN202410070427.2
申请日:2024-01-17
Applicant: 北京邮电大学
IPC: G06V40/20 , G06V40/10 , G06V10/98 , G06V10/26 , G06V10/32 , G06V10/25 , G06T17/00 , G06N3/0475 , G06V10/44 , G06N3/047 , G06N3/0464 , G06N3/045
Abstract: 本发明提供一种基于扩散模型的手部检测和三维姿态估计方法及系统,所述方法的步骤包括:将待检测图像输入到第一扩散模型中,第一扩散模型对待检测图像中的手部区域添加边界框;基于边界框对所述待检测图像进行裁剪,将裁剪图像输入到第二扩散模型中,第二扩散模型对在裁剪图像标记手部的第一关节点;基于第一关节点的位置确定手部的各个骨骼长度和各个骨骼的骨骼旋转角度;基于骨骼长度和骨骼的骨骼旋转角度确定每个第一关节点对应的轴角,计算每个第一关节点对应的旋转矩阵;基于每个第一关节点的关节路线,对该关节路线上的第一关节点对应的旋转矩阵进行计算,将第一关节点对应转化为第二关节点;基于所述第二关节点的坐标数据构建手部图像。
-
-
-