-
公开(公告)号:CN119851148A
公开(公告)日:2025-04-18
申请号:CN202411733922.3
申请日:2024-11-29
Applicant: 电子科技大学
IPC: G06V20/13 , G06V10/774 , G06V10/32 , G06V10/44 , G06V10/80 , G06V10/82 , G06N3/0455 , G06N3/048 , G06N3/08 , G06N3/045
Abstract: 本发明公开了一种大模型驱动的高分辨率遥感图像解译方法,属于图像处理与分析领域。本发明包括:构建大规模的高分辨遥感图像数据集;对数据进行清洗和标注,划分训练集和验证集;构建多模态遥感信息智能提取大模型,实现多模态遥感特征的提取与协同;构建多模态遥感信息融合模块,实现可见光编码特征和热红外编码特征的融合;基于当前大语言模型的编码器来处理融合后的多模态特征,实现高分辨率遥感图像的解译。本发明所提方法的实施,能有效提升高分辨遥感图像解译的准确度。
-
公开(公告)号:CN120014288A
公开(公告)日:2025-05-16
申请号:CN202411963075.X
申请日:2024-12-30
Applicant: 电子科技大学
IPC: G06V10/44 , G06V10/80 , G06V10/42 , G06V10/82 , G06N3/0464 , G06N3/0455 , G06N3/096
Abstract: 本申请公开了一种面向复杂场景信息先验的遥感图像自然语言描述生成方法,属于图像处理与分析领域。本申请所提方法包括:构建中文和英文联合的数据集;构建视觉的全局特征和局部特征;构建信息先验特征;对全局特征和局部特征的强化处理;进行多特征交叉融合;对交叉融合后的特征执行自然语言描述生成。本申请通过上述技术方案,提高了对涉及大量复杂场景的遥感图像描述的准确性。
-
公开(公告)号:CN117830895A
公开(公告)日:2024-04-05
申请号:CN202311866985.1
申请日:2023-12-28
Applicant: 电子科技大学
IPC: G06V20/40 , G06V10/20 , G06V10/774 , G06V10/40 , G06V10/764 , G06V10/82
Abstract: 本发明公开了一种机场场面目标活动的时序标注自主生成方法,属于机场场面智能运控及计算机视觉领域。本发明包括:搜集获取公开运动目标视频数据并预处理;构建预训练的时空特征提取网络获取视频时空特征;构建弱监督目标行为检测网络生成目标活动类激活序列及活动状态序列;构建时序标注生成器自主生成时序标注;采集机场场面目标数据提取时空特征;进行迁移训练并生成初始活动标注;基于初始活动标注进行迭代推理并更新活动标注。本发明通过上述技术方案,在极少使用人力资源成本的前提下,自主学习并生成精准机场场面目标活动的时序标注,有效提高机场场面运控智能化水平。
-
公开(公告)号:CN118799958A
公开(公告)日:2024-10-18
申请号:CN202410734469.1
申请日:2024-06-07
Applicant: 电子科技大学
IPC: G06V40/20 , G06V10/80 , G06V10/764 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/082
Abstract: 本发明公开了一种多模信息下的人体动作时序检测方法,涉及视频理解及计算机视觉领域。本发明包括:搜集公开人体动作视频数据并完成预处理;生成文本提示序列并提取文本特征;构建多模态时序特征提取器提取多模态时空特征序列;构建多模态时序响应模块生成动作响应序列;构建动作提名生成器生成动作提名;构建多模态实例级动作检测模块实现人体动作检测。本发明通过上述技术方案,充分利用多模态数据有效信息,提升人体动作检测精度。
-
-
-