基于相互学习的深度强化学习方法

    公开(公告)号:CN118446278A

    公开(公告)日:2024-08-06

    申请号:CN202410486393.5

    申请日:2024-04-22

    Abstract: 本发明公开一种基于相互学习的深度强化学习方法,包括:定义主智能体和互智能体,初始化两个智能体的神经网络,将两个智能体的神经网络的超参数设置保持一致;初始化主智能体的神经网络和互智能体的神经网络的环境;从主智能体的神经网络和互智能体的神经网络的经验池中分别随意抽取一批状态,通过状态采样动作,并计算损失函数,损失函数为两个子损失函数的线性相加的结果;使用反向传播算法更新两神经网络的参数以最小化损失函数,所述方法能够提高学习效率,提升DRL模型的整体性能。

    基于深度学习的区块链工作量证明共识方法

    公开(公告)号:CN117974304A

    公开(公告)日:2024-05-03

    申请号:CN202311857062.X

    申请日:2023-12-29

    Abstract: 本申请公开一种基于深度学习的区块链工作量证明共识方法,包括:任务分发中心发布深度学习任务并进行任务分发;所有全量节点接收客户端的交易请求,在本地将交易组织为区块,等待上链;全量节点利用本地数据集独立进行模型训练及验证任务;经过模型训练及验证任务的全量节点将新生成区块广播给所有其他全量节点进行验证;全量节点模型训练完成经由其他全量节点验证模型,其他全量节点认可该模型并复制区块上链,任务训练完成,任务中心节点下发其他任务,所述方法采用区块链共识机制,将全量求解哈希难题转换成训练深度学习模型,能够将涉及到的算力资源用于解决有用的任务,既可以创造出新的生产价值,又保证了区块的正常生成。

Patent Agency Ranking