-
公开(公告)号:CN119962562A
公开(公告)日:2025-05-09
申请号:CN202411941041.0
申请日:2024-12-26
Applicant: 中国科学院自动化研究所
Abstract: 本发明提供一种基于不确定性特征的对手建模方法和装置,包括:获取智能体与环境交互过程中的交互数据;交互数据包括当前己方观测数据、当前己方动作数据、当前对手观测数据、当前对手动作数据、第一环境奖励数据和下一步己方观测数据;将当前己方观测数据和当前己方动作数据输入对手建模模型,建模对手的确定性特征和不确定性特征得到模型输出;利用当前对手观测数据、当前对手动作数据、第一环境奖励数据和下一步己方观测数据,以及模型输出计算损失函数;基于损失函数优化模型得到训练后的模型;基于训练后的模型进行对手建模得到对手建模结果。本发明引入了确定性和不确定性混合的特征,从而有效地提高了对具有随机性行为的对手的建模能力。
-
公开(公告)号:CN118395131B
公开(公告)日:2024-11-12
申请号:CN202410843987.7
申请日:2024-06-27
Applicant: 中国科学院自动化研究所
Abstract: 本发明提供一种多算子协同侦察方法、装置、设备、存储介质及程序产品,应用于数据处理技术领域。该方法包括:获取兵棋的态势数据,所述态势数据包括:地图合法坐标集合、算子当前坐标集合、当前已观测视野坐标集合、目标观测区域的中心点坐标和区域半径;根据所述态势数据计算地面算子合法根节点坐标,得到地面算子合法根节点坐标集合;通过子节点可行性分析从所述地面算子合法根节点坐标集合中确定目标地面算子合法根节点坐标;根据所述目标地面算子合法根节点坐标和所述态势数据计算空中算子合法根节点坐标,得到空中算子合法根节点坐标集合;通过子节点可行性分析从所述空中算子合法根节点坐标集合中确定目标空中算子合法根节点坐标。
-
公开(公告)号:CN118395131A
公开(公告)日:2024-07-26
申请号:CN202410843987.7
申请日:2024-06-27
Applicant: 中国科学院自动化研究所
Abstract: 本发明提供一种多算子协同侦察方法、装置、设备、存储介质及程序产品,应用于数据处理技术领域。该方法包括:获取兵棋的态势数据,所述态势数据包括:地图合法坐标集合、算子当前坐标集合、当前已观测视野坐标集合、目标观测区域的中心点坐标和区域半径;根据所述态势数据计算地面算子合法根节点坐标,得到地面算子合法根节点坐标集合;通过子节点可行性分析从所述地面算子合法根节点坐标集合中确定目标地面算子合法根节点坐标;根据所述目标地面算子合法根节点坐标和所述态势数据计算空中算子合法根节点坐标,得到空中算子合法根节点坐标集合;通过子节点可行性分析从所述空中算子合法根节点坐标集合中确定目标空中算子合法根节点坐标。
-
-