-
公开(公告)号:CN116189280A
公开(公告)日:2023-05-30
申请号:CN202211594956.X
申请日:2022-12-13
Applicant: 北京交通大学 , 中移雄安信息通信科技有限公司 , 中移系统集成有限公司
IPC: G06V40/20 , G06V10/774 , G06V10/82 , G06V10/80 , G06V10/764 , G06V20/40 , G06V10/74 , G06N3/047 , G06N3/08 , G06N3/0464 , G06N3/0455
Abstract: 本发明提供一种基于子空间分类的小样本行为识别方法及系统,属于计算机识别技术领域,包括:获取待识别的图像;利用预先训练好的小样本行为识别模型对所述获取的待识别图像进行处理,得到图像中行为识别结果;所述小样本行为识别模型包括深度估计网络、特征提取网络、特征融合网络和识别网络。本发明充分利用支持集每一类中的所有样本特征,通过为每一类行为构建子空间来进行分类,而非直接地使用特征均值;将每一类的样本特征凝练为一个子空间,直接计算查询样本特征到子空间的距离,而非依次计算查询样本特征到每一类中每个样本的距离,减少计算量。
-
公开(公告)号:CN116110121A
公开(公告)日:2023-05-12
申请号:CN202211594563.9
申请日:2022-12-13
Applicant: 北京交通大学 , 中移雄安信息通信科技有限公司 , 中移系统集成有限公司
IPC: G06V40/20 , G06V20/40 , G06V10/62 , G06V10/764 , G06V10/80 , G06V10/82 , G06N3/045 , G06N3/0464 , G06N3/048
Abstract: 本发明提供一种基于特征压缩的轻量化行为识别方法及系统,属于计算机识别技术领域,包括:获取待识别视频序列;利用预先训练好的识别模型对所述获取的待识别视频序列进行处理,得到视频中的行为识别结果;其中,预先训练好的识别模型包括特征提取网络和分类网络,特征提取网络包括至少一个瓶颈结构,瓶颈结构包括依次连接的两个特征压缩模块。本发明能够有效减少卷积神经网络的计算量和参数量,同时高效的提取特征图中的信息;能够通过注意力机制对时空特征进行激活,使网络更关注于有价值的特征信息上,可简便的方式建模视频帧之间的运动信息;具有较低的参数量和运算量。
-
公开(公告)号:CN119048856A
公开(公告)日:2024-11-29
申请号:CN202410887796.0
申请日:2024-07-03
Applicant: 北京交通大学 , 中移雄安信息通信科技有限公司 , 中移系统集成有限公司 , 中移信息系统集成有限公司
IPC: G06V10/774
Abstract: 本申请实施例提供了一种图像标注方法、装置、设备及存储介质。图像标注方法包括:获取视频数据,根据视频数据确定初始数据集及候选数据集;根据初始数据集确定第一标注数据集,并通过标注模型对候选数据集进行标注处理,确定第二标注数据集;其中,标注模型是基于第一标注数据集训练得到的;对第二标注数据集进行筛选,得到第三标注数据集;根据第一标注数据集及第三标注数据集确定视频数据对应的图像标注结果。本申请实施例通过对标注模型标注的图像进行筛选,提高了图像标注的效率及准确性。
-
公开(公告)号:CN116189281B
公开(公告)日:2024-04-02
申请号:CN202211595034.0
申请日:2022-12-13
Applicant: 北京交通大学 , 中移雄安信息通信科技有限公司 , 中移系统集成有限公司
IPC: G06V40/20 , G06V10/764 , G06V10/82 , G06V10/778 , G06V10/80 , G06N3/082 , G06N3/0464 , G06N3/0499 , G06N3/045
Abstract: 本发明提供基于时空自适应融合的端到端人体行为分类方法及系统,属于计算机识别技术领域,获取待分类行为的多个图像;利用基于时空自适应融合的端到端人体行为分类模型对多个图像进行处理,得到行为特征图像,基于时空自适应融合的端到端人体行为分类模型根据基于时空自适应融合的端到端人体行为分类模型训练方法训练得到。本发明在网络结构上控制了计算复杂度和参数量,后期轻量化过程减少了特征在时间和空间维度上的关键信息丢失,保证模型在性能和效率之间的平衡;针对时间维度上的特征通道自适应剪枝,根据情况挑选保留、丢弃和复用的通道,减少了参数量;针对不同行为对象关系建模的自适应剪枝,减少模型在空间维度上的计算复杂度和参数量。
-
公开(公告)号:CN116189281A
公开(公告)日:2023-05-30
申请号:CN202211595034.0
申请日:2022-12-13
Applicant: 北京交通大学 , 中移雄安信息通信科技有限公司 , 中移系统集成有限公司
IPC: G06V40/20 , G06V10/764 , G06V10/82 , G06V10/778 , G06V10/80 , G06N3/082 , G06N3/0464 , G06N3/0499 , G06N3/045
Abstract: 本发明提供基于时空自适应融合的端到端人体行为分类方法及系统,属于计算机识别技术领域,获取待分类行为的多个图像;利用基于时空自适应融合的端到端人体行为分类模型对多个图像进行处理,得到行为特征图像,基于时空自适应融合的端到端人体行为分类模型根据基于时空自适应融合的端到端人体行为分类模型训练方法训练得到。本发明在网络结构上控制了计算复杂度和参数量,后期轻量化过程减少了特征在时间和空间维度上的关键信息丢失,保证模型在性能和效率之间的平衡;针对时间维度上的特征通道自适应剪枝,根据情况挑选保留、丢弃和复用的通道,减少了参数量;针对不同行为对象关系建模的自适应剪枝,减少模型在空间维度上的计算复杂度和参数量。
-
公开(公告)号:CN117911710A
公开(公告)日:2024-04-19
申请号:CN202311750746.X
申请日:2023-12-19
Applicant: 北京交通大学 , 中移雄安信息通信科技有限公司
IPC: G06V10/44 , G06V10/771 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/0895
Abstract: 本发明提供一种多光谱目标检测模型训练方法、目标检测方法及系统,属于基于深度学习的目标检测技术领域。本发明面对恶劣天气等目标可视性差等问题时,在轮廓增强模块实现数据增强的效果,显著提升目标检测的准确性和鲁棒性。加入轻量化融合聚焦模块,将特征细分为高频和低频特征,在保证模型较低计算量的同时,更好地从可见光和红外模态中提取细节信息,将不同空间位置目标的关键信息聚焦到可见光‑红外模态上,利用Transformer的自注意机制对可见光‑红外特征的互补信息进行适当融合。对比度桥模块,利用对比度学习的思想来指导模型提高其在VIS‑IR场景中感知模态不变特征的能力,弥合可见光和红外模态之间的差距,使其适应真实的复杂的可见‑红外场景。
-
公开(公告)号:CN113920302B
公开(公告)日:2025-03-07
申请号:CN202111037829.5
申请日:2021-09-06
Applicant: 北京交通大学
IPC: G06V10/25 , G06V10/44 , G06V10/774 , G06V10/74 , G06V10/80 , G06N3/0464 , G06N3/08
Abstract: 本发明提供了一种基于交叉注意力机制的多头弱监督目标检测方法,包括:获取图像,对图像进行处理,将处理后的图像分成训练集和测试集;定义类原型特征,构建包含类原型特征的基于交叉注意力机制的弱监督目标检测网络WCAN模型;采用训练数据集对WCAN模型进行训练;基于训练好的WCAN模型,对测试集图像进行目标检测。本方法在只有类别标签的条件下,能够更全面地、充分地感知位置和类别信息,实现更准确高效的目标检测。
-
公开(公告)号:CN119418168A
公开(公告)日:2025-02-11
申请号:CN202410952324.9
申请日:2024-07-16
Applicant: 北京交通大学
IPC: G06V10/82 , G06V10/80 , G06N5/025 , G06V10/74 , G06N3/0455 , G06N3/084 , G06N3/0985 , G06V10/764
Abstract: 本发明提供一种基于元学习的多模态关系抽取方法及系统,属于文本实体识别技术领域,获取待预测的文本图像对;利用预先训练好的关系预测模型对获取的文本图象对进行处理,得到实体之间的多模态关系。本发明提出基于元学习的多模态关系抽取框架,适用于任何基于梯度下降的关系分类模型;通过元学习从头部关系类中学习获得初始参数,然后对尾项特征学习过程中的模型参数进行微调,它利用了从头部数据中学习到的先验知识,实现从易到难的任务学习;增强了尾部类的特征表示,弥合头类和尾类之间的特征差距,提高了关系识别的性能;在稀有类别训练时,动态地提高正梯度的权重并降低负梯度的权重,用于解决尾部数据稀疏问题。
-
公开(公告)号:CN118862144A
公开(公告)日:2024-10-29
申请号:CN202410837156.9
申请日:2024-06-26
Applicant: 北京交通大学
IPC: G06F21/62 , G06N3/0464 , G06N3/0442 , G06N3/094 , G06F18/25 , G06F18/22
Abstract: 本发明提供一种多模态隐私数据生成模型训练方法、数据生成方法及系统,属于数据隐私保护技术领域,本发明实现了在一个统一框架中生成RGB图像和表格数据,无需使用额外的公开数据和端到端的训练方式,并且各类型数据的生成过程中相互联系,提升了生成数据的语义一致性,能够有效融合不同模态的关键信息实现准确的多模态数据判别;提出多角度判别与多模态匹配损失,多模态判别损失主导GAN模型的训练过程,单模态判别损失用于辅助模型平衡不同模态的学习效率,匹配损失促进模型对模态间关系的学习。为了降低生成模型的隐私泄漏风险,提出将差分隐私机制应用在基于GAN的图像与表格数据联合生成模型上,以平衡合成数据的可用性与隐私性。
-
公开(公告)号:CN118230263A
公开(公告)日:2024-06-21
申请号:CN202410111708.8
申请日:2024-01-26
Applicant: 北京交通大学
Abstract: 本发明提供一种骑行流量及人流量轻量化监控方法及装置,属于基于机器视觉的交通流量监控技术领域,获取慢行交通道路非机动车道视频,进行预处理,得到所需格式的视频图像序列进行标注,输入模型进行训练,得到训练轮次内平均精确度最高的权重文件,用于目标检测和跟踪算法;在检测视频中划分非机动车道区域,检测非机动车道上的机动车辆;利用训练好的模型,对非机动车道行驶的机动车进行识别检测,为每辆车分配唯一的标识;维护一个集合,记录每个标识和对应的数量;根据目标标识和集合,动态更新骑行流量和行人流量数据。本发明通过目标的唯一标识,可以动态更新人流量和骑行流量数据,提供了准确、实时、稳定可靠的慢行交通数据。
-
-
-
-
-
-
-
-
-