-
公开(公告)号:CN119886269A
公开(公告)日:2025-04-25
申请号:CN202411673370.1
申请日:2024-11-21
Applicant: 北京航天计量测试技术研究所
Abstract: 一种人工智能主体深度强化学习不确定性估计方法,主要包括以下步骤:将基于深度强化学习的决策不确定性分解为偶然不确定性和认知不确定性;基于贝叶斯和非贝叶斯方法,计算每个不确定度的基本分量;合成获得标准不确定度以及扩展。该方法突破了传统深度强化学习不确定性估计的建模方法,以贝叶斯和非贝叶斯的方式评估不确定度,能够有效减少人工智能主体深度强化学习探索‑利用所需的时间。