-
公开(公告)号:CN118155161A
公开(公告)日:2024-06-07
申请号:CN202410105601.2
申请日:2024-01-25
IPC: G06V20/56 , G06V10/44 , G06V10/42 , G06V10/771 , G06V10/80 , G06V10/764 , G06V10/776 , G06N3/0464 , G06N3/048 , G06N3/084 , G06N3/08 , G06N3/09
Abstract: 本发明提供一种基于图像全局感受野的道路隔离带检测方法及装置,属于基于机器视觉的道路检测技术领域,获取待检测的道路隔离带图像;利用基于图像全局感受野的道路隔离带检测模型对获取的图像进行处理,得到道路隔离带类型检测结果;其中,所述基于图像全局感受野的道路隔离带检测模型基于所述训练数据训练得到;通过经过层层卷积的前向传播过程获得预测的道路隔离带形式,计算预测结果与真实标签之间的损失,并通过损失进行反向传播,以更新模型权重,直至达到设定的迭代轮数为止。本发明增加了网络层的感受野,精确判断场景的机非隔离形式,提高了预测结果的全面性和精确度。
-
公开(公告)号:CN119625818A
公开(公告)日:2025-03-14
申请号:CN202411417104.2
申请日:2024-10-11
Applicant: 北京交通大学
IPC: G06V40/20 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于多层级特征融合的行为识别方法及装置,包括步骤:步骤S1:多层级特征的收集;步骤S2:时序特征显著性表达;步骤S3:多层次特征融合方法;步骤S4;输出目标任务结果。本发明首次同时考虑了三维卷积神经网络中的时序感受野首先问题和不同运动速率分辨能力弱的问题,使三维卷积神经网络在维持计算开销变化不大的情况下有效提升行为识别的准确率。本发明设计了时序特征显著性表达机制,通过对特征进行显著性表达处理,获取全局时空信息,增强模型的长时序建模能力。设计多层级特征融合模块,利用不同层级特征对运动速率的感知能力,增强模型的分辨力,实现单输入源下不同动作速率的行为识别能力。
-
公开(公告)号:CN118366186A
公开(公告)日:2024-07-19
申请号:CN202410475803.6
申请日:2024-04-19
Applicant: 北京交通大学
IPC: G06V40/10 , G06V10/40 , G06V10/774 , G06V10/82
Abstract: 本发明提供一种基于多级跨模态联合对齐的行人重识别方法及系统,属于机器视觉图像处理技术领域,获取待识别的图像数据;利用预先训练好的行人重识别模型对获取的待识别的图像进行处理,得到图像中行人重识别结果。本发明提出可见红外模态协调器并以加权灰度、跨通道剪切混合和频谱抖动协调器三种不同的方式,减轻了可见光和红外图像之间的差异,弥合了图像级别的模态差距;引入具有可训练参数的模态分布适配器,捕获特征图的空间统计特征并自适应地对齐不同模态的特征分布,减少特征级别的模态差距;引入跨模态检索损失,减少VI‑ReID目标层面的差距;引入多光谱增强排序策略,增强了模型的鲁棒性和跨模态检索能力。
-
公开(公告)号:CN119048856A
公开(公告)日:2024-11-29
申请号:CN202410887796.0
申请日:2024-07-03
Applicant: 北京交通大学 , 中移雄安信息通信科技有限公司 , 中移系统集成有限公司 , 中移信息系统集成有限公司
IPC: G06V10/774
Abstract: 本申请实施例提供了一种图像标注方法、装置、设备及存储介质。图像标注方法包括:获取视频数据,根据视频数据确定初始数据集及候选数据集;根据初始数据集确定第一标注数据集,并通过标注模型对候选数据集进行标注处理,确定第二标注数据集;其中,标注模型是基于第一标注数据集训练得到的;对第二标注数据集进行筛选,得到第三标注数据集;根据第一标注数据集及第三标注数据集确定视频数据对应的图像标注结果。本申请实施例通过对标注模型标注的图像进行筛选,提高了图像标注的效率及准确性。
-
公开(公告)号:CN119169524A
公开(公告)日:2024-12-20
申请号:CN202411201034.7
申请日:2024-08-29
Applicant: 北京交通大学
Abstract: 本发明提供一种基于跨模态融合的异常行为检测方法及系统,属于异常行为检测技术领域,利用预先训练好的异常行为检测模型对获取的视频数据进行处理,得到异常行为检测结果。异常行为检测模型包括视觉特征提取网络、音频特征提取网络、跨模态融合网络、双曲图卷积网络以及行为预测网络。本发明引入了新的跨模态融合算法,在时间维度上实现了音频特征与视觉特征的融合,利用音频信息对视觉维度模糊的事件做进一步区分;设计基于双曲图卷积的两个分支,分别处理特征的相似度和时间关联关系,并在双曲空间中提高特征的区分度,提升了异常行为检测的准确度。
-
公开(公告)号:CN118537793A
公开(公告)日:2024-08-23
申请号:CN202410632368.3
申请日:2024-05-21
Applicant: 北京交通大学
IPC: G06V20/52 , G06V20/70 , G06V10/25 , G06V10/44 , G06N3/0464
Abstract: 本发明提供一种基于点对点框架的人群计数方法及系统,属于基于计算机视觉的人群计数技术领域,获取待识别的图像;利用预先训练好的人群计数识别模型对获取的图像进行处理,得到人群计数识别结果;其中,训练模型包括:将训练集图像输入进骨干网络进行特征图的提取;将特征图分别输入到坐标预测头和置信度计算头的三层卷积网络中,分别得到预测点坐标和置信度;损失函数计算,利用PyTorch框架的自动求导机制,根据得到的损失值计算模型参数梯度方向,更新模型参数。本发明利用数据集中的点标注信息,在不引入额外的标注工作量的情况下对样本尺寸信息进行了估计,以此计算出每个标注点对于最终的损失函数的影响权重,提升了模型检测不同尺度目标的能力。
-
公开(公告)号:CN118862144A
公开(公告)日:2024-10-29
申请号:CN202410837156.9
申请日:2024-06-26
Applicant: 北京交通大学
IPC: G06F21/62 , G06N3/0464 , G06N3/0442 , G06N3/094 , G06F18/25 , G06F18/22
Abstract: 本发明提供一种多模态隐私数据生成模型训练方法、数据生成方法及系统,属于数据隐私保护技术领域,本发明实现了在一个统一框架中生成RGB图像和表格数据,无需使用额外的公开数据和端到端的训练方式,并且各类型数据的生成过程中相互联系,提升了生成数据的语义一致性,能够有效融合不同模态的关键信息实现准确的多模态数据判别;提出多角度判别与多模态匹配损失,多模态判别损失主导GAN模型的训练过程,单模态判别损失用于辅助模型平衡不同模态的学习效率,匹配损失促进模型对模态间关系的学习。为了降低生成模型的隐私泄漏风险,提出将差分隐私机制应用在基于GAN的图像与表格数据联合生成模型上,以平衡合成数据的可用性与隐私性。
-
公开(公告)号:CN118230263A
公开(公告)日:2024-06-21
申请号:CN202410111708.8
申请日:2024-01-26
Applicant: 北京交通大学
Abstract: 本发明提供一种骑行流量及人流量轻量化监控方法及装置,属于基于机器视觉的交通流量监控技术领域,获取慢行交通道路非机动车道视频,进行预处理,得到所需格式的视频图像序列进行标注,输入模型进行训练,得到训练轮次内平均精确度最高的权重文件,用于目标检测和跟踪算法;在检测视频中划分非机动车道区域,检测非机动车道上的机动车辆;利用训练好的模型,对非机动车道行驶的机动车进行识别检测,为每辆车分配唯一的标识;维护一个集合,记录每个标识和对应的数量;根据目标标识和集合,动态更新骑行流量和行人流量数据。本发明通过目标的唯一标识,可以动态更新人流量和骑行流量数据,提供了准确、实时、稳定可靠的慢行交通数据。
-
公开(公告)号:CN117911710A
公开(公告)日:2024-04-19
申请号:CN202311750746.X
申请日:2023-12-19
Applicant: 北京交通大学 , 中移雄安信息通信科技有限公司
IPC: G06V10/44 , G06V10/771 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/0895
Abstract: 本发明提供一种多光谱目标检测模型训练方法、目标检测方法及系统,属于基于深度学习的目标检测技术领域。本发明面对恶劣天气等目标可视性差等问题时,在轮廓增强模块实现数据增强的效果,显著提升目标检测的准确性和鲁棒性。加入轻量化融合聚焦模块,将特征细分为高频和低频特征,在保证模型较低计算量的同时,更好地从可见光和红外模态中提取细节信息,将不同空间位置目标的关键信息聚焦到可见光‑红外模态上,利用Transformer的自注意机制对可见光‑红外特征的互补信息进行适当融合。对比度桥模块,利用对比度学习的思想来指导模型提高其在VIS‑IR场景中感知模态不变特征的能力,弥合可见光和红外模态之间的差距,使其适应真实的复杂的可见‑红外场景。
-
-
-
-
-
-
-
-