-
公开(公告)号:CN117765476A
公开(公告)日:2024-03-26
申请号:CN202311840043.6
申请日:2023-12-29
Applicant: 电子科技大学
IPC: G06V20/52 , G06V10/44 , G06V10/80 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本发明公开了一种可持续学习的机场场面活动分析方法,属于机场场面智能运控及视频处理技术领域。本发明包括:采集包含场面活动的视频数据并进行人工标注;对原始视频进行预处理;构建类别增量任务序列;构建特征提取模块获取视频的时空特征;构建时序编码器,对特征序列进行编码;构建分类器,完成对场面活动的在线分析;构建下采样模块,对当前任务视频进行信息最优下采样;下采样样本前向传播,保存与任务样本特征最接近的下采样视频;根据此任务是否为最终任务决定是否终止。本发明在极少的内存消耗与算力消耗下,通过信息最优下采样与特征距离最近分类,克服了持续学习过程中出现的灾难性遗忘现象,有效提高机场场面智能化运控能力。
-
公开(公告)号:CN117934815A
公开(公告)日:2024-04-26
申请号:CN202410128664.X
申请日:2024-01-30
Applicant: 电子科技大学
IPC: G06V10/25 , G06V10/774 , G06V10/764 , G06V10/762 , G06V10/52 , G06V10/80 , G06V10/82 , G06V10/776 , G06V20/50 , G06V20/70 , G06T7/194 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种面向机场实时场面运控跨域目标检测方法,属于图像处理技术领域。本发明包括:采集在不同天气条件下机场场面图像并进行标注;确定不同的迁移场景,划分出源域数据集和目标域数据集;构建图像分簇模块,对训练图像进行处理;构建前背景分离模块,对图像进行特征提取;构建浅层背景特征域对齐模块,设计背景域分类损失,实现背景特征域细粒度对齐;构建深层前景模块,实现深层前景特征域对齐;联合多个域不变学习模块,实现机场场面的实时跨域目标检测。本发明只在模型训练阶段优化检测器,不增加任何推理过程中的计算量,保证了目标检测的实时性,极大提高了机场场面智能运控在恶劣条件下的实时检测精度。
-
公开(公告)号:CN119135849A
公开(公告)日:2024-12-13
申请号:CN202411605023.5
申请日:2024-11-12
Applicant: 电子科技大学
Abstract: 本发明提供了一种机场航站楼视频数字孪生方法、装置、设备及介质,首先获取多传感器采集的数据,然后构建高精度机场航站楼静态三维模型,并以世界坐标系为基准,构建二维图像坐标系、航站楼静态三维模型坐标系、摄像机坐标系之间的映射关系,获取航站楼空间初始布局,以二维布局估计为关键点,对图像纹理进行重建,实现单摄像机下二维图像纹理至航站楼静态三维模型的注册,最后计算融合渲染过程中的缝合线,将多摄像机二维图像与构建的静态三维模型进行融合,以实现航站楼三维全景数字孪生。通过本发明方案,实现了航站楼多摄像头、结构化数据、航站楼室内模型融合大场景下三维实景可视化,实现了全面实时监测,保障了机场的安全运行。
-
公开(公告)号:CN119135849B
公开(公告)日:2025-02-18
申请号:CN202411605023.5
申请日:2024-11-12
Applicant: 电子科技大学
Abstract: 本发明提供了一种机场航站楼视频数字孪生方法、装置、设备及介质,首先获取多传感器采集的数据,然后构建高精度机场航站楼静态三维模型,并以世界坐标系为基准,构建二维图像坐标系、航站楼静态三维模型坐标系、摄像机坐标系之间的映射关系,获取航站楼空间初始布局,以二维布局估计为关键点,对图像纹理进行重建,实现单摄像机下二维图像纹理至航站楼静态三维模型的注册,最后计算融合渲染过程中的缝合线,将多摄像机二维图像与构建的静态三维模型进行融合,以实现航站楼三维全景数字孪生。通过本发明方案,实现了航站楼多摄像头、结构化数据、航站楼室内模型融合大场景下三维实景可视化,实现了全面实时监测,保障了机场的安全运行。
-
公开(公告)号:CN117807271A
公开(公告)日:2024-04-02
申请号:CN202311833902.9
申请日:2023-12-28
Applicant: 电子科技大学
IPC: G06F16/783 , G06V10/40 , G06V10/774
Abstract: 本发明公开了一种机场运控视频检索的方法,属于机场场面运控管理及人工智能多模态领域。本发明包括:采集包含机场人体动作的视频数据并做文本描述与时序标注;对原始视频数据进行预处理生成数据集;构建基于I3D的骨干网络获取视频特征序列;构建基于自注意力的视频序列分析器;构建文本序列分析器对标注文本进行嵌入;取标注文本嵌入后特征与其对应的视频片段经过视频序列分析器得到的特征计算相似性;构建基于提示学习的文本处理方法,处理后送入文本序列分析器进行嵌入;构建基于互注意力的多模态融合模型,完成对视频流中文本描述片段的定位与检索。本发明通过上述技术方案,在减少模型计算量的前提下大幅提升了机场运控视频检索的准确度。
-
-
-
-