-
公开(公告)号:CN117911710A
公开(公告)日:2024-04-19
申请号:CN202311750746.X
申请日:2023-12-19
Applicant: 北京交通大学 , 中移雄安信息通信科技有限公司
IPC: G06V10/44 , G06V10/771 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/0895
Abstract: 本发明提供一种多光谱目标检测模型训练方法、目标检测方法及系统,属于基于深度学习的目标检测技术领域。本发明面对恶劣天气等目标可视性差等问题时,在轮廓增强模块实现数据增强的效果,显著提升目标检测的准确性和鲁棒性。加入轻量化融合聚焦模块,将特征细分为高频和低频特征,在保证模型较低计算量的同时,更好地从可见光和红外模态中提取细节信息,将不同空间位置目标的关键信息聚焦到可见光‑红外模态上,利用Transformer的自注意机制对可见光‑红外特征的互补信息进行适当融合。对比度桥模块,利用对比度学习的思想来指导模型提高其在VIS‑IR场景中感知模态不变特征的能力,弥合可见光和红外模态之间的差距,使其适应真实的复杂的可见‑红外场景。
-
公开(公告)号:CN116189280A
公开(公告)日:2023-05-30
申请号:CN202211594956.X
申请日:2022-12-13
Applicant: 北京交通大学 , 中移雄安信息通信科技有限公司 , 中移系统集成有限公司
IPC: G06V40/20 , G06V10/774 , G06V10/82 , G06V10/80 , G06V10/764 , G06V20/40 , G06V10/74 , G06N3/047 , G06N3/08 , G06N3/0464 , G06N3/0455
Abstract: 本发明提供一种基于子空间分类的小样本行为识别方法及系统,属于计算机识别技术领域,包括:获取待识别的图像;利用预先训练好的小样本行为识别模型对所述获取的待识别图像进行处理,得到图像中行为识别结果;所述小样本行为识别模型包括深度估计网络、特征提取网络、特征融合网络和识别网络。本发明充分利用支持集每一类中的所有样本特征,通过为每一类行为构建子空间来进行分类,而非直接地使用特征均值;将每一类的样本特征凝练为一个子空间,直接计算查询样本特征到子空间的距离,而非依次计算查询样本特征到每一类中每个样本的距离,减少计算量。
-
公开(公告)号:CN116110121A
公开(公告)日:2023-05-12
申请号:CN202211594563.9
申请日:2022-12-13
Applicant: 北京交通大学 , 中移雄安信息通信科技有限公司 , 中移系统集成有限公司
IPC: G06V40/20 , G06V20/40 , G06V10/62 , G06V10/764 , G06V10/80 , G06V10/82 , G06N3/045 , G06N3/0464 , G06N3/048
Abstract: 本发明提供一种基于特征压缩的轻量化行为识别方法及系统,属于计算机识别技术领域,包括:获取待识别视频序列;利用预先训练好的识别模型对所述获取的待识别视频序列进行处理,得到视频中的行为识别结果;其中,预先训练好的识别模型包括特征提取网络和分类网络,特征提取网络包括至少一个瓶颈结构,瓶颈结构包括依次连接的两个特征压缩模块。本发明能够有效减少卷积神经网络的计算量和参数量,同时高效的提取特征图中的信息;能够通过注意力机制对时空特征进行激活,使网络更关注于有价值的特征信息上,可简便的方式建模视频帧之间的运动信息;具有较低的参数量和运算量。
-
公开(公告)号:CN116189281B
公开(公告)日:2024-04-02
申请号:CN202211595034.0
申请日:2022-12-13
Applicant: 北京交通大学 , 中移雄安信息通信科技有限公司 , 中移系统集成有限公司
IPC: G06V40/20 , G06V10/764 , G06V10/82 , G06V10/778 , G06V10/80 , G06N3/082 , G06N3/0464 , G06N3/0499 , G06N3/045
Abstract: 本发明提供基于时空自适应融合的端到端人体行为分类方法及系统,属于计算机识别技术领域,获取待分类行为的多个图像;利用基于时空自适应融合的端到端人体行为分类模型对多个图像进行处理,得到行为特征图像,基于时空自适应融合的端到端人体行为分类模型根据基于时空自适应融合的端到端人体行为分类模型训练方法训练得到。本发明在网络结构上控制了计算复杂度和参数量,后期轻量化过程减少了特征在时间和空间维度上的关键信息丢失,保证模型在性能和效率之间的平衡;针对时间维度上的特征通道自适应剪枝,根据情况挑选保留、丢弃和复用的通道,减少了参数量;针对不同行为对象关系建模的自适应剪枝,减少模型在空间维度上的计算复杂度和参数量。
-
公开(公告)号:CN116189281A
公开(公告)日:2023-05-30
申请号:CN202211595034.0
申请日:2022-12-13
Applicant: 北京交通大学 , 中移雄安信息通信科技有限公司 , 中移系统集成有限公司
IPC: G06V40/20 , G06V10/764 , G06V10/82 , G06V10/778 , G06V10/80 , G06N3/082 , G06N3/0464 , G06N3/0499 , G06N3/045
Abstract: 本发明提供基于时空自适应融合的端到端人体行为分类方法及系统,属于计算机识别技术领域,获取待分类行为的多个图像;利用基于时空自适应融合的端到端人体行为分类模型对多个图像进行处理,得到行为特征图像,基于时空自适应融合的端到端人体行为分类模型根据基于时空自适应融合的端到端人体行为分类模型训练方法训练得到。本发明在网络结构上控制了计算复杂度和参数量,后期轻量化过程减少了特征在时间和空间维度上的关键信息丢失,保证模型在性能和效率之间的平衡;针对时间维度上的特征通道自适应剪枝,根据情况挑选保留、丢弃和复用的通道,减少了参数量;针对不同行为对象关系建模的自适应剪枝,减少模型在空间维度上的计算复杂度和参数量。
-
公开(公告)号:CN119048856A
公开(公告)日:2024-11-29
申请号:CN202410887796.0
申请日:2024-07-03
Applicant: 北京交通大学 , 中移雄安信息通信科技有限公司 , 中移系统集成有限公司 , 中移信息系统集成有限公司
IPC: G06V10/774
Abstract: 本申请实施例提供了一种图像标注方法、装置、设备及存储介质。图像标注方法包括:获取视频数据,根据视频数据确定初始数据集及候选数据集;根据初始数据集确定第一标注数据集,并通过标注模型对候选数据集进行标注处理,确定第二标注数据集;其中,标注模型是基于第一标注数据集训练得到的;对第二标注数据集进行筛选,得到第三标注数据集;根据第一标注数据集及第三标注数据集确定视频数据对应的图像标注结果。本申请实施例通过对标注模型标注的图像进行筛选,提高了图像标注的效率及准确性。
-
公开(公告)号:CN117952829A
公开(公告)日:2024-04-30
申请号:CN202410074545.0
申请日:2024-01-18
Applicant: 中移雄安信息通信科技有限公司 , 中移系统集成有限公司 , 中国移动通信集团有限公司
IPC: G06T3/4053 , G06V10/44 , G06V10/774 , G06V10/82 , G06N3/0464
Abstract: 本申请涉及一种图像重建模型训练方法、图像重建方法、装置及设备,涉及图像处理技术领域。该方法包括:获取训练图像集,该训练图像集中包含待重建样本图像、重建样本集以及样本图像对应的标准图像;通过图像重建模型对重建样本集中的各个图像进行多层级特征提取,获得重建样本集中的各个图像各自对应的多个层级的特征信息;通过图像重建模型基于各个图像各自对应的多个层级的特征信息,生成各个图像各自的特征矩阵;通过图像重建模型基于各个图像各自的特征矩阵对待重建样本图像进行图像重建,获得待重建样本图像的重建结果;基于重建结果与标准图像对图像重建模型进行训练。通过上述方法,可以提高训练获得的图像重建模型的图像重建效果。
-
公开(公告)号:CN117952829B
公开(公告)日:2025-04-25
申请号:CN202410074545.0
申请日:2024-01-18
Applicant: 中移雄安信息通信科技有限公司 , 中移系统集成有限公司 , 中国移动通信集团有限公司
IPC: G06T3/4053 , G06V10/44 , G06V10/774 , G06V10/82 , G06N3/0464
Abstract: 本申请涉及一种图像重建模型训练方法、图像重建方法、装置及设备,涉及图像处理技术领域。该方法包括:获取训练图像集,该训练图像集中包含待重建样本图像、重建样本集以及样本图像对应的标准图像;通过图像重建模型对重建样本集中的各个图像进行多层级特征提取,获得重建样本集中的各个图像各自对应的多个层级的特征信息;通过图像重建模型基于各个图像各自对应的多个层级的特征信息,生成各个图像各自的特征矩阵;通过图像重建模型基于各个图像各自的特征矩阵对待重建样本图像进行图像重建,获得待重建样本图像的重建结果;基于重建结果与标准图像对图像重建模型进行训练。通过上述方法,可以提高训练获得的图像重建模型的图像重建效果。
-
公开(公告)号:CN116934605A
公开(公告)日:2023-10-24
申请号:CN202210364759.2
申请日:2022-04-07
Applicant: 中移系统集成有限公司 , 中移雄安信息通信科技有限公司 , 中国移动通信集团有限公司
Inventor: 田卉
IPC: G06T5/00 , G06N3/08 , G06N3/0464
Abstract: 本申请涉及图像处理领域,提供一种图像去噪方法、装置、电子设备及计算机程序产品。所述方法包括:获取原始含噪图像,对原始含噪图像进行下采样处理,得到第一含噪图像;在第一含噪图像包含噪声估计信息的情况下,将第一含噪图像包含的噪声估计信息输入单路卷积网络,得到特征信息;将原始含噪图像以及特征信息输入多重空洞卷积网络进行训练,得到第一去噪图像;在第一含噪图像不包含噪声估计信息的情况下,将原始含噪图像输入多重空洞卷积网络进行训练,得到第一去噪图像。本申请通过多重空洞卷积网络提取图像不同深度下的噪声特征信息,使得提取出的噪声特征信息更接近于真实噪声分布,更好地适用于处理真实环境下的噪声图像。
-
-
-
-
-
-
-
-