利用合成环境改进强化学习的设备和方法

    公开(公告)号:CN114757331A

    公开(公告)日:2022-07-15

    申请号:CN202210014020.9

    申请日:2022-01-07

    Abstract: 提供了利用合成环境改进强化学习的设备和方法。一种用于学习策略()的计算机实现的方法和/或用于学习合成环境的方法,其中所述策略被配置为控制智能体,包括以下步骤:提供合成环境参数()和真实环境()以及策略群体。后续,重复以下步骤达预定次数的重复作为第一循环:对策略群体中的每个策略实行后续步骤作为第二循环:用随机噪声干扰合成环境参数();针对受干扰的合成环境训练策略达第一给定数量的步骤;通过确定训练策略的奖励,针对真实环境评估训练策略;取决于噪声和奖励更新合成环境参数。最后,输出针对真实环境具有最高奖励或针对受干扰的合成环境具有最佳训练策略的评估策略()。

    用于创建自动创建机器学习系统的系统的方法和设备

    公开(公告)号:CN113989801A

    公开(公告)日:2022-01-28

    申请号:CN202110777133.X

    申请日:2021-07-09

    Abstract: 用于创建系统的计算机实现的方法,所述系统适合于为基于计算机的视觉自动创建机器学习系统,所述方法包括以下步骤:提供预给定的超参数。借助于BOHB(贝叶斯优化(BO)和超频带(HB)的缩写)为多个不同训练数据集确定所述超参数的最优参数化。借助于标准化度量评估对所述多个不同训练数据集的所有训练数据集的所有最优参数化。创建矩阵,其中所述矩阵具有针对每个参数化和每个训练数据集的经过评估的标准化度量。确定每个训练数据集的元特征(英语:meta‑features)。优化决策树,所述决策树根据所述元特征和所述矩阵使得所述决策树输出借助于BOHB确定的最优参数化中的哪个是适合于给定元特征的参数化。

Patent Agency Ranking