-
公开(公告)号:CN116189281B
公开(公告)日:2024-04-02
申请号:CN202211595034.0
申请日:2022-12-13
Applicant: 北京交通大学 , 中移雄安信息通信科技有限公司 , 中移系统集成有限公司
IPC: G06V40/20 , G06V10/764 , G06V10/82 , G06V10/778 , G06V10/80 , G06N3/082 , G06N3/0464 , G06N3/0499 , G06N3/045
Abstract: 本发明提供基于时空自适应融合的端到端人体行为分类方法及系统,属于计算机识别技术领域,获取待分类行为的多个图像;利用基于时空自适应融合的端到端人体行为分类模型对多个图像进行处理,得到行为特征图像,基于时空自适应融合的端到端人体行为分类模型根据基于时空自适应融合的端到端人体行为分类模型训练方法训练得到。本发明在网络结构上控制了计算复杂度和参数量,后期轻量化过程减少了特征在时间和空间维度上的关键信息丢失,保证模型在性能和效率之间的平衡;针对时间维度上的特征通道自适应剪枝,根据情况挑选保留、丢弃和复用的通道,减少了参数量;针对不同行为对象关系建模的自适应剪枝,减少模型在空间维度上的计算复杂度和参数量。
-
公开(公告)号:CN116189281A
公开(公告)日:2023-05-30
申请号:CN202211595034.0
申请日:2022-12-13
Applicant: 北京交通大学 , 中移雄安信息通信科技有限公司 , 中移系统集成有限公司
IPC: G06V40/20 , G06V10/764 , G06V10/82 , G06V10/778 , G06V10/80 , G06N3/082 , G06N3/0464 , G06N3/0499 , G06N3/045
Abstract: 本发明提供基于时空自适应融合的端到端人体行为分类方法及系统,属于计算机识别技术领域,获取待分类行为的多个图像;利用基于时空自适应融合的端到端人体行为分类模型对多个图像进行处理,得到行为特征图像,基于时空自适应融合的端到端人体行为分类模型根据基于时空自适应融合的端到端人体行为分类模型训练方法训练得到。本发明在网络结构上控制了计算复杂度和参数量,后期轻量化过程减少了特征在时间和空间维度上的关键信息丢失,保证模型在性能和效率之间的平衡;针对时间维度上的特征通道自适应剪枝,根据情况挑选保留、丢弃和复用的通道,减少了参数量;针对不同行为对象关系建模的自适应剪枝,减少模型在空间维度上的计算复杂度和参数量。
-
公开(公告)号:CN117911710A
公开(公告)日:2024-04-19
申请号:CN202311750746.X
申请日:2023-12-19
Applicant: 北京交通大学 , 中移雄安信息通信科技有限公司
IPC: G06V10/44 , G06V10/771 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/0895
Abstract: 本发明提供一种多光谱目标检测模型训练方法、目标检测方法及系统,属于基于深度学习的目标检测技术领域。本发明面对恶劣天气等目标可视性差等问题时,在轮廓增强模块实现数据增强的效果,显著提升目标检测的准确性和鲁棒性。加入轻量化融合聚焦模块,将特征细分为高频和低频特征,在保证模型较低计算量的同时,更好地从可见光和红外模态中提取细节信息,将不同空间位置目标的关键信息聚焦到可见光‑红外模态上,利用Transformer的自注意机制对可见光‑红外特征的互补信息进行适当融合。对比度桥模块,利用对比度学习的思想来指导模型提高其在VIS‑IR场景中感知模态不变特征的能力,弥合可见光和红外模态之间的差距,使其适应真实的复杂的可见‑红外场景。
-
公开(公告)号:CN116189280A
公开(公告)日:2023-05-30
申请号:CN202211594956.X
申请日:2022-12-13
Applicant: 北京交通大学 , 中移雄安信息通信科技有限公司 , 中移系统集成有限公司
IPC: G06V40/20 , G06V10/774 , G06V10/82 , G06V10/80 , G06V10/764 , G06V20/40 , G06V10/74 , G06N3/047 , G06N3/08 , G06N3/0464 , G06N3/0455
Abstract: 本发明提供一种基于子空间分类的小样本行为识别方法及系统,属于计算机识别技术领域,包括:获取待识别的图像;利用预先训练好的小样本行为识别模型对所述获取的待识别图像进行处理,得到图像中行为识别结果;所述小样本行为识别模型包括深度估计网络、特征提取网络、特征融合网络和识别网络。本发明充分利用支持集每一类中的所有样本特征,通过为每一类行为构建子空间来进行分类,而非直接地使用特征均值;将每一类的样本特征凝练为一个子空间,直接计算查询样本特征到子空间的距离,而非依次计算查询样本特征到每一类中每个样本的距离,减少计算量。
-
公开(公告)号:CN116110121A
公开(公告)日:2023-05-12
申请号:CN202211594563.9
申请日:2022-12-13
Applicant: 北京交通大学 , 中移雄安信息通信科技有限公司 , 中移系统集成有限公司
IPC: G06V40/20 , G06V20/40 , G06V10/62 , G06V10/764 , G06V10/80 , G06V10/82 , G06N3/045 , G06N3/0464 , G06N3/048
Abstract: 本发明提供一种基于特征压缩的轻量化行为识别方法及系统,属于计算机识别技术领域,包括:获取待识别视频序列;利用预先训练好的识别模型对所述获取的待识别视频序列进行处理,得到视频中的行为识别结果;其中,预先训练好的识别模型包括特征提取网络和分类网络,特征提取网络包括至少一个瓶颈结构,瓶颈结构包括依次连接的两个特征压缩模块。本发明能够有效减少卷积神经网络的计算量和参数量,同时高效的提取特征图中的信息;能够通过注意力机制对时空特征进行激活,使网络更关注于有价值的特征信息上,可简便的方式建模视频帧之间的运动信息;具有较低的参数量和运算量。
-
公开(公告)号:CN119048856A
公开(公告)日:2024-11-29
申请号:CN202410887796.0
申请日:2024-07-03
Applicant: 北京交通大学 , 中移雄安信息通信科技有限公司 , 中移系统集成有限公司 , 中移信息系统集成有限公司
IPC: G06V10/774
Abstract: 本申请实施例提供了一种图像标注方法、装置、设备及存储介质。图像标注方法包括:获取视频数据,根据视频数据确定初始数据集及候选数据集;根据初始数据集确定第一标注数据集,并通过标注模型对候选数据集进行标注处理,确定第二标注数据集;其中,标注模型是基于第一标注数据集训练得到的;对第二标注数据集进行筛选,得到第三标注数据集;根据第一标注数据集及第三标注数据集确定视频数据对应的图像标注结果。本申请实施例通过对标注模型标注的图像进行筛选,提高了图像标注的效率及准确性。
-
公开(公告)号:CN114565752B
公开(公告)日:2024-12-27
申请号:CN202210133345.9
申请日:2022-02-10
Applicant: 北京交通大学
IPC: G06V10/25 , G06V10/26 , G06V10/75 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/045 , G06N3/0895
Abstract: 本发明提供了一种基于类不可知前景挖掘的图像弱监督目标检测方法。该方法包括:基于待进行目标检测的图像通过CNN生成前景注意力图;基于前景注意力图计算每个候选框的前景相对置信度FRC,根据各个候选框的FRC筛选出前景候选框;基于前景候选框构建实例空间图,基于数据集的标签构建标签语义图,对实例空间图和标签语义图进行图匹配,根据图匹配结果为每个前景候选框进行分类;根据各个前景候选框的分类结果生成伪监督框,将伪监督框与伪监督框的空间近邻框进行合并得到伪实例标签,将该伪实例标签作为待进行目标检测的图像的目标检测结果。本发明把定位和分类任务分离,从而实现的定位与分类性能的双向提升,有效地提升图像的弱监督目标检测性能。
-
公开(公告)号:CN119169524A
公开(公告)日:2024-12-20
申请号:CN202411201034.7
申请日:2024-08-29
Applicant: 北京交通大学
Abstract: 本发明提供一种基于跨模态融合的异常行为检测方法及系统,属于异常行为检测技术领域,利用预先训练好的异常行为检测模型对获取的视频数据进行处理,得到异常行为检测结果。异常行为检测模型包括视觉特征提取网络、音频特征提取网络、跨模态融合网络、双曲图卷积网络以及行为预测网络。本发明引入了新的跨模态融合算法,在时间维度上实现了音频特征与视觉特征的融合,利用音频信息对视觉维度模糊的事件做进一步区分;设计基于双曲图卷积的两个分支,分别处理特征的相似度和时间关联关系,并在双曲空间中提高特征的区分度,提升了异常行为检测的准确度。
-
公开(公告)号:CN118732499A
公开(公告)日:2024-10-01
申请号:CN202410715378.3
申请日:2024-06-04
Applicant: 北京交通大学
Abstract: 本发明提供高速铁路列车自主协同运行控制方法及系统,属于高速铁路列车运行控制技术领域,构建复杂运行环境下高速铁路自主感知理论模块;从自主感知理论模块提取数据,构建协同条件下高速列车运行控制模型,得到面向状态驱动的高速列车智能自主控制模块,构建动力学列车模型,输出协同条件下多车追踪优化方法,得到基于车车通信的多车追踪间隔优化控制模块;得到多层域列车群博弈模型,获取基于群体智能的列车群分布式协同控制模块,实现列车群分布式协同运行控制。本发明生成基于全局信息的控制调度多尺度推荐策略和面向状态驱动的运行时主动防护曲线,实现了基于群体智能的分布式控制,有效提升行车安全性和运行效率,最大化提升旅客运输能力。
-
公开(公告)号:CN118537793A
公开(公告)日:2024-08-23
申请号:CN202410632368.3
申请日:2024-05-21
Applicant: 北京交通大学
IPC: G06V20/52 , G06V20/70 , G06V10/25 , G06V10/44 , G06N3/0464
Abstract: 本发明提供一种基于点对点框架的人群计数方法及系统,属于基于计算机视觉的人群计数技术领域,获取待识别的图像;利用预先训练好的人群计数识别模型对获取的图像进行处理,得到人群计数识别结果;其中,训练模型包括:将训练集图像输入进骨干网络进行特征图的提取;将特征图分别输入到坐标预测头和置信度计算头的三层卷积网络中,分别得到预测点坐标和置信度;损失函数计算,利用PyTorch框架的自动求导机制,根据得到的损失值计算模型参数梯度方向,更新模型参数。本发明利用数据集中的点标注信息,在不引入额外的标注工作量的情况下对样本尺寸信息进行了估计,以此计算出每个标注点对于最终的损失函数的影响权重,提升了模型检测不同尺度目标的能力。
-
-
-
-
-
-
-
-
-