-
公开(公告)号:CN117830895A
公开(公告)日:2024-04-05
申请号:CN202311866985.1
申请日:2023-12-28
Applicant: 电子科技大学
IPC: G06V20/40 , G06V10/20 , G06V10/774 , G06V10/40 , G06V10/764 , G06V10/82
Abstract: 本发明公开了一种机场场面目标活动的时序标注自主生成方法,属于机场场面智能运控及计算机视觉领域。本发明包括:搜集获取公开运动目标视频数据并预处理;构建预训练的时空特征提取网络获取视频时空特征;构建弱监督目标行为检测网络生成目标活动类激活序列及活动状态序列;构建时序标注生成器自主生成时序标注;采集机场场面目标数据提取时空特征;进行迁移训练并生成初始活动标注;基于初始活动标注进行迭代推理并更新活动标注。本发明通过上述技术方案,在极少使用人力资源成本的前提下,自主学习并生成精准机场场面目标活动的时序标注,有效提高机场场面运控智能化水平。
-
公开(公告)号:CN119135849A
公开(公告)日:2024-12-13
申请号:CN202411605023.5
申请日:2024-11-12
Applicant: 电子科技大学
Abstract: 本发明提供了一种机场航站楼视频数字孪生方法、装置、设备及介质,首先获取多传感器采集的数据,然后构建高精度机场航站楼静态三维模型,并以世界坐标系为基准,构建二维图像坐标系、航站楼静态三维模型坐标系、摄像机坐标系之间的映射关系,获取航站楼空间初始布局,以二维布局估计为关键点,对图像纹理进行重建,实现单摄像机下二维图像纹理至航站楼静态三维模型的注册,最后计算融合渲染过程中的缝合线,将多摄像机二维图像与构建的静态三维模型进行融合,以实现航站楼三维全景数字孪生。通过本发明方案,实现了航站楼多摄像头、结构化数据、航站楼室内模型融合大场景下三维实景可视化,实现了全面实时监测,保障了机场的安全运行。
-
公开(公告)号:CN115100540B
公开(公告)日:2024-05-07
申请号:CN202210778771.8
申请日:2022-06-30
Applicant: 电子科技大学
Abstract: 本发明涉及视频图像处理技术领域,尤其涉及一种高分辨率遥感影像道路自动提取的方法,本发明通过加入多Agent系统,在深度卷积神经网络模型的训练过程中,在输入的高分辨率遥感影像上分区域创建生成Agent,由生成Agent随机生成大量的提取Agent,不同的提取Agent负责遍历不同的区域,再将路图迭代生成算法模型加入每个提取Agent的运行周期中,通过同一区域内不同提取Agent间、提取Agent和生成Agent间,以及不同区域的生成Agent间的信息共享、协同合作完成整张遥感影像的道路提取任务。本发明通过多Agent技术实现模型高效训练,又能利用深度学习的强大特征学习能力,实现高效率和高准确性的高分辨率遥感影像道路提取。
-
公开(公告)号:CN114613004B
公开(公告)日:2023-08-01
申请号:CN202210206087.2
申请日:2022-02-28
Applicant: 电子科技大学
IPC: G06V40/20 , G06V10/764 , G06V10/82 , G06N3/047 , G06N3/0464 , G06N3/08
Abstract: 本发明属于视频处理技术领域,具体涉及一种人体动作的轻量化在线检测方法,本发明包括:步骤1:采集视频数据并标注分块;步骤2:对视频块预处理并生成在线检测数据集;步骤3:基于SlowFast构建特征提取网络,得到视频块特征;步骤4:构建基于双路孪生网络对特征进行辨别性映射;步骤5:构建基于Informer概率稀疏注意力与注意力蒸馏的时序编码器,得到时序编码特征;步骤6:构建基于Informer概率稀疏注意力的时序解码器进行时序解码,将解码结果送入分类器得到人体动作在线检测结果,基于多时态检测结果对整体网络联合优化;本发明通过上述技术方案,极大减少了时序推理运算量,提高了在线动作检测效率和精度。
-
公开(公告)号:CN114926900A
公开(公告)日:2022-08-19
申请号:CN202210532569.7
申请日:2022-05-10
Applicant: 电子科技大学
IPC: G06V40/20 , G06V20/40 , G06V10/764 , G06V10/82 , G06V10/774 , G06N3/04 , G06N3/08
Abstract: 本发明属于视频处理技术领域,具体涉及一种前背景分离的人体动作在线检测方法,本发明包括:采集包含人体动作的视频数据并做时序标注;对原始视频数据进行预处理生成数据集;构建基于I3D的骨干网络进行特征提取;构建特征映射模块,设计基于特征模长的对比损失函数,对前背景特征进行初次分离;构建可学习的前景记忆特征与互注意力模块,计算特征序列元素与前景的相似性以分离前背景;构建基于自注意力机制的时序推理器,结合前背景分离结果对特征序列编码;构建分类器基于编码结果完成对人体动作的在线检测。本发明在极少增加模型运算量的前提下,极大提高了待检测人体动作视频帧与历史视频帧之间的辨别性,进而提高人体动作在线检测的检测精度。
-
公开(公告)号:CN119135849B
公开(公告)日:2025-02-18
申请号:CN202411605023.5
申请日:2024-11-12
Applicant: 电子科技大学
Abstract: 本发明提供了一种机场航站楼视频数字孪生方法、装置、设备及介质,首先获取多传感器采集的数据,然后构建高精度机场航站楼静态三维模型,并以世界坐标系为基准,构建二维图像坐标系、航站楼静态三维模型坐标系、摄像机坐标系之间的映射关系,获取航站楼空间初始布局,以二维布局估计为关键点,对图像纹理进行重建,实现单摄像机下二维图像纹理至航站楼静态三维模型的注册,最后计算融合渲染过程中的缝合线,将多摄像机二维图像与构建的静态三维模型进行融合,以实现航站楼三维全景数字孪生。通过本发明方案,实现了航站楼多摄像头、结构化数据、航站楼室内模型融合大场景下三维实景可视化,实现了全面实时监测,保障了机场的安全运行。
-
公开(公告)号:CN115116072B
公开(公告)日:2025-02-11
申请号:CN202210819627.4
申请日:2022-07-12
Applicant: 电子科技大学
Abstract: 本发明属于文本识别技术领域,具体涉及一种基于基线定位与序列建模的自然场景下的藏文识别方法,本发明包括:1)构建自然场景下的藏文图像数据集并进行标注;2)扩充数据集并对数据集图像进行预处理;3)构建基线检测器,对藏文文本的基线位置进行定位;4)构建特征提取器,使用不同的特征提取方法获取横竖排文本图像的序列特征表示;5)构建基于TCN的序列建模网络,建模序列关系;6)构建CTC转录模块,将表征序列关系的输出特征送入转录层得到藏文识别的结果。本发明通过上述技术方案,极大的增强了特征提取、序列关系建模的有效性,提高了序列的并行处理能力,进而提高了自然场景下藏文识别的精度和效率。
-
公开(公告)号:CN114926900B
公开(公告)日:2023-06-16
申请号:CN202210532569.7
申请日:2022-05-10
Applicant: 电子科技大学
IPC: G06V40/20 , G06V20/40 , G06V10/764 , G06V10/82 , G06V10/774 , G06N3/0464 , G06N3/048 , G06N3/08 , G06N5/04
Abstract: 本发明属于视频处理技术领域,具体涉及一种前背景分离的人体动作在线检测方法,本发明包括:采集包含人体动作的视频数据并做时序标注;对原始视频数据进行预处理生成数据集;构建基于I3D的骨干网络进行特征提取;构建特征映射模块,设计基于特征模长的对比损失函数,对前背景特征进行初次分离;构建可学习的前景记忆特征与互注意力模块,计算特征序列元素与前景的相似性以分离前背景;构建基于自注意力机制的时序推理器,结合前背景分离结果对特征序列编码;构建分类器基于编码结果完成对人体动作的在线检测。本发明在极少增加模型运算量的前提下,极大提高了待检测人体动作视频帧与历史视频帧之间的辨别性,进而提高人体动作在线检测的检测精度。
-
公开(公告)号:CN115423141A
公开(公告)日:2022-12-02
申请号:CN202210742434.3
申请日:2022-06-28
Applicant: 电子科技大学
Abstract: 本发明属于事件预测技术领域,具体涉及一种航班延误下突发事件预测方法、装置及电子设备,该方法包括:定义评价指标;确定评价指标的隶属度值;定义旅客利益受损函数;将旅客利益受损函数转换为模糊隶属函数;构建基于多目标模糊决策的旅客决策行为模型;确定旅客决策行为的表达式;提取突发事件中旅客的群体特征数据与个体特征数据;确定初始受影响个体的特征参数;确定每个旅客空间位置数据;定义情绪感染因子;确定旅客群体中各个旅客个体在不同时刻的空间位置的表达式;确定突发事件形成过程的函数表达式。本发明实现了突发事件演化规律的定量描述;实现航班延误下的突发事件的监测及预测。
-
公开(公告)号:CN115116072A
公开(公告)日:2022-09-27
申请号:CN202210819627.4
申请日:2022-07-12
Applicant: 电子科技大学
Abstract: 本发明属于文本识别技术领域,具体涉及一种基于基线定位与序列建模的自然场景下的藏文识别方法,本发明包括:1)构建自然场景下的藏文图像数据集并进行标注;2)扩充数据集并对数据集图像进行预处理;3)构建基线检测器,对藏文文本的基线位置进行定位;4)构建特征提取器,使用不同的特征提取方法获取横竖排文本图像的序列特征表示;5)构建基于TCN的序列建模网络,建模序列关系;6)构建CTC转录模块,将表征序列关系的输出特征送入转录层得到藏文识别的结果。本发明通过上述技术方案,极大的增强了特征提取、序列关系建模的有效性,提高了序列的并行处理能力,进而提高了自然场景下藏文识别的精度和效率。
-
-
-
-
-
-
-
-
-