-
公开(公告)号:CN112749785B
公开(公告)日:2024-12-24
申请号:CN202011146544.0
申请日:2020-10-23
Applicant: 株式会社东芝 , 东芝数字解决方案株式会社
IPC: G06N3/0464 , G06N3/042 , G06N3/048 , G06N3/092
Abstract: 本发明提供一种能够制作社会基础设施的变更方案的信息处理装置、信息处理方法以及程序。信息处理装置具有定义部、判定部以及强化学习部。定义部将属性与节点和边缘建立对应而进行定义,基于表示系统的结构的图结构的数据,定义与表示图结构的数据的模型相关的卷积函数。评价部对模型输入系统的状态,针对使模型按每个时间步长产生可设想的结构变化后的一个以上的变更后模型的体系,按每个时间步长求出策略函数与状态价值函数,并基于策略函数评价系统的结构变化。强化学习部通过使用将所述结构变化应用于系统的情况下所产生的成本即回报值、状态价值函数、模型来进行强化学习,从而使系统的结构变化优化。
-
公开(公告)号:CN112749785A
公开(公告)日:2021-05-04
申请号:CN202011146544.0
申请日:2020-10-23
Applicant: 株式会社东芝 , 东芝数字解决方案株式会社
Abstract: 本发明提供一种能够制作社会基础设施的变更方案的信息处理装置、信息处理方法以及程序。信息处理装置具有定义部、判定部以及强化学习部。定义部将属性与节点和边缘建立对应而进行定义,基于表示系统的结构的图结构的数据,定义与表示图结构的数据的模型相关的卷积函数。评价部对模型输入系统的状态,针对使模型按每个时间步长产生可设想的结构变化后的一个以上的变更后模型的体系,按每个时间步长求出策略函数与状态价值函数,并基于策略函数评价系统的结构变化。强化学习部通过使用将所述结构变化应用于系统的情况下所产生的成本即回报值、状态价值函数、模型来进行强化学习,从而使系统的结构变化优化。
-