深度强化学习方法、装置、设备及存储介质

    公开(公告)号:CN117591868A

    公开(公告)日:2024-02-23

    申请号:CN202210946401.0

    申请日:2022-08-08

    Applicant: 苏州大学

    Abstract: 本发明涉及一种深度强化学习方法、装置、设备及存储介质。所述深度强化学习方法包括:获取模型在分类任务的执行中针对样本的分类动作,并与获取的所述样本的标签进行对比;根据分类动作与所述标签的符合情况,确定当前轮的分类任务的终止状态;其中,所述样本包括第一样本和第二样本,所述第一样本的数量小于所述第二样本的数量。本发明所提供的深度强化学习方法、装置、设备及存储介质,能实现正负样本的均衡分类,进而提高模型对样本分类的准确性。

Patent Agency Ranking