用于预测性计算机建模的装置和方法

    公开(公告)号:CN116685963A

    公开(公告)日:2023-09-01

    申请号:CN202080108157.X

    申请日:2020-12-23

    Abstract: 一种用于生成现实世界环境的预测模型的装置,多个对象在所述现实世界环境中改变状态。所述装置包括一个或多个处理器,所述一个或多个处理器用于:接收状态信息,所述状态信息表示多个训练对象在相应时间段内状态的一个或多个变化;训练神经网络,以估计每个训练对象的变量因子(u)。所述变量因子是根据所述训练对象在由所述状态信息定义的时间段内的一系列状态进行估计的。所述变量因子(u)是通过重复优化以下两者之间的损失函数进行估计的:(i)所述训练对象在由所述状态信息定义的给定时间的第一状态,(ii)根据由所述状态信息在所述给定时间之前的时间定义的所述训练对象的状态,由第一模型在所述给定时间估计的所述训练对象的第二状态。

    用于预测性计算机建模的装置和方法

    公开(公告)号:CN116685963B

    公开(公告)日:2024-09-06

    申请号:CN202080108157.X

    申请日:2020-12-23

    Abstract: 一种用于生成现实世界环境的预测模型的装置,多个对象在所述现实世界环境中改变状态。所述装置包括一个或多个处理器,所述一个或多个处理器用于:接收状态信息,所述状态信息表示多个训练对象在相应时间段内状态的一个或多个变化;训练神经网络,以估计每个训练对象的变量因子(u)。所述变量因子是根据所述训练对象在由所述状态信息定义的时间段内的一系列状态进行估计的。所述变量因子(u)是通过重复优化以下两者之间的损失函数进行估计的:(i)所述训练对象在由所述状态信息定义的给定时间的第一状态,(ii)根据由所述状态信息在所述给定时间之前的时间定义的所述训练对象的状态,由第一模型在所述给定时间估计的所述训练对象的第二状态。

    强化学习的方法和装置
    3.
    发明授权

    公开(公告)号:CN111612126B

    公开(公告)日:2024-06-21

    申请号:CN202010308484.1

    申请日:2020-04-18

    Abstract: 本申请涉及人工智能,提供了一种强化学习方法和装置,能够提高强化学习的训练效率。该方法包括:获取结构图,结构图包括通过学习获取的环境或智能体的结构信息;向智能体的策略函数输入环境的当前状态和结构图,策略函数用于生成响应于当前状态和结构图的动作,智能体的策略函数为图神经网络;利用智能体向环境输出动作;利用智能体从环境获取响应于动作的下一个状态和奖励数据;根据奖励数据,对智能体进行强化学习的训练。

    一种用于图像处理的神经网络以及相关设备

    公开(公告)号:CN111695596A

    公开(公告)日:2020-09-22

    申请号:CN202010362629.6

    申请日:2020-04-30

    Abstract: 本申请涉及人工智能领域中的图像处理技术,公开了一种用于图像处理的神经网络以及相关设备。方法包括:将对抗图像分别输入第一特征提取网络和第二特征提取网络,得到鲁棒表示和非鲁棒表示,将鲁棒表示和非鲁棒表示分别输入分类网络,得到分类网络输出的第一分类类别和第二分类类别;根据第一损失函数进行迭代训练,直至满足收敛条件,第一损失函数用于表示第一类别和与对抗图像对应的正确类别之间的相似度,且用于表示第二分类类别和与对抗图像对应的错误类别之间的相似度,既避免了鲁棒表示和非鲁棒表示混杂从而导致鲁棒性的降低,也能够同时保留鲁棒表示和非鲁棒表示,从而避免了准确率的降低,以同时提升神经网络的鲁棒性和准确率。

    强化学习的方法和装置
    6.
    发明公开

    公开(公告)号:CN111612126A

    公开(公告)日:2020-09-01

    申请号:CN202010308484.1

    申请日:2020-04-18

    Abstract: 本申请涉及人工智能,提供了一种强化学习方法和装置,能够提高强化学习的训练效率。该方法包括:获取结构图,结构图包括通过学习获取的环境或智能体的结构信息;向智能体的策略函数输入环境的当前状态和结构图,策略函数用于生成响应于当前状态和结构图的动作,智能体的策略函数为图神经网络;利用智能体向环境输出动作;利用智能体从环境获取响应于动作的下一个状态和奖励数据;根据奖励数据,对智能体进行强化学习的训练。

Patent Agency Ranking