一种基于场景语言感知引导的多模态无人机目标检测框架

    公开(公告)号:CN119360243A

    公开(公告)日:2025-01-24

    申请号:CN202411395067.X

    申请日:2024-10-08

    Abstract: 本发明属于计算机视觉技术领域,公开了一种基于场景语言感知引导的多模态无人机目标检测框架。首先,将视觉‑语言预训练模型嵌入多模态目标检测框架中,提出了场景语言感知模块,利用视觉‑语言预训练模型为模型提供场景智能感知和理解能力。其次,通过条件参数生成模块根据当前场景和目标特征动态生成融合参数,通过为不同目标定制个性化的融合模式提升模型对场景变化的适应能力。最后,设计了多模态动态解码器,建立了动态对称融合机制,通过动态挖掘多模态数据间的复杂互补关联实现多模态特征融合,并根据当前场景实时调整不同模态的重要性,将DETR的解码机制从单模态扩展到多模态,为多模态无人机目标检测提供了无需先验框的新范式。

    一种基于轴向注意力的UUV非合作目标跟踪方法

    公开(公告)号:CN118688807B

    公开(公告)日:2024-12-20

    申请号:CN202410706764.6

    申请日:2024-06-03

    Abstract: 本发明公开了一种基于轴向注意力的UUV非合作目标跟踪方法。本发明针对前视声呐观测的不可靠性、目标运动的不可预测性,构建带有记忆的一阶马尔可夫状态空间模型描述声呐观测下UUV非合作目标跟踪机理,并提出一种基于轴向注意力Transformer的非合作目标状态多步预测网络,用于描述非线性观测下,非合作目标相对声呐的复杂运动过程。针对观测的不稳定性及后验分布的未知性,基于Monte Carlo近似推断原理,利用该多步预测网络将目标观测状态空间中的采样粒子映射到目标预测状态空间,构建基于轴向注意力的目标跟踪方法,提高UUV非合作目标跟踪对不确定输入的适应性和鲁棒性。

    一种基于安全互模拟度量的视觉强化学习方法

    公开(公告)号:CN117933349B

    公开(公告)日:2024-07-26

    申请号:CN202410106823.6

    申请日:2024-01-25

    Abstract: 本发明公开了一种基于安全互模拟度量的视觉强化学习方法,首先,建立序列条件变分推断模型、安全互模拟度量模型与安全强化学习模型,并初始化模型参数;对于每个环境步,收集经验样本,构建拉格朗日损失函数,并更新拉格朗日乘子;对于每个梯度步,从经验回放池中采样数据序列,构建序列条件变分推断模型损失函数与安全互模拟度量模型损失函数并更新模型参数,构建安全强化学习模型并更新模型参数;最后,重复上述步骤直到获得最优模型参数。本发明能够学习到紧凑且富含信息的视觉状态表征,同时满足预设的安全约束要求。

    一种基于经验导向Q学习的锅炉汽轮机系统负荷控制方法

    公开(公告)号:CN118192249A

    公开(公告)日:2024-06-14

    申请号:CN202410428471.6

    申请日:2024-04-10

    Abstract: 本发明公开了一种基于经验导向Q学习的锅炉汽轮机系统负荷控制方法,包括:将原始负荷控制问题转化为关于跟踪误差的增广误差系统调节问题;基于锅炉汽轮机运行历史数据构建经验池,提出离策略Q学习方法,根据批量采样信息更新状态‑动作值函数,设计评价神经网络近似Q函数,并结合最小二乘法迭代更新状态‑动作值Q函数;再利用的采样‑训练循环嵌套训练框架,进一步在线优化评价网络权值;设计Q学习自适应控制器,生成具有优化趋向的数据存入经验池,实现Q学习算法的导向学习,以自适应调整系统的负荷控制策略。本发明高效利用系统运行数据和经验导向的学习方式,解决了锅炉汽轮机系统负荷控制中的数据利用难和数据质量要求高等难题。

    一种基于安全互模拟度量的视觉强化学习方法

    公开(公告)号:CN117933349A

    公开(公告)日:2024-04-26

    申请号:CN202410106823.6

    申请日:2024-01-25

    Abstract: 本发明公开了一种基于安全互模拟度量的视觉强化学习方法,首先,建立序列条件变分推断模型、安全互模拟度量模型与安全强化学习模型,并初始化模型参数;对于每个环境步,收集经验样本,构建拉格朗日损失函数,并更新拉格朗日乘子;对于每个梯度步,从经验回放池中采样数据序列,构建序列条件变分推断模型损失函数与安全互模拟度量模型损失函数并更新模型参数,构建安全强化学习模型并更新模型参数;最后,重复上述步骤直到获得最优模型参数。本发明能够学习到紧凑且富含信息的视觉状态表征,同时满足预设的安全约束要求。

    一种基于值分布DDPG算法的燃煤发电系统协调控制方法

    公开(公告)号:CN116755409A

    公开(公告)日:2023-09-15

    申请号:CN202310812903.9

    申请日:2023-07-04

    Abstract: 本发明公开了一种基于值分布DDPG算法的燃煤发电系统协调控制方法,包括:将燃煤发电系统协调控制问题建模为马尔可夫决策过程;通过Q函数评估长期期望控制代价函数,使用分位数对标量Q值进行分布建模;引入贝尔曼算子的分布型表达式构建目标分布,度量分布之间的1‑Wassertein最小距离,设计分位数损失与最小化分布之间的距离;构建估计网络和目标网络两个行动者‑评论家网络结构,标准化燃煤发电系统的数据样本,采用DDPG算法以实现对值分布的估计和策略的更新,得到协调控制策略。本发明基于系统运行数据和值分布DDPG算法解决了环境复杂不确定性燃煤发电系统协调控制中难以精确建模、缺乏自适应能力等难题。

Patent Agency Ranking