-
公开(公告)号:CN119272850A
公开(公告)日:2025-01-07
申请号:CN202411433141.2
申请日:2024-10-14
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N3/0985 , G06N3/092 , G06Q10/0631 , G06Q10/083
Abstract: 本说明书一个或多个实施例提供一种分配任务求解器的超参数确定方法、设备、介质及产品。该方法包括:将用于确定分配任务求解器的超参数的策略函数作为强化学习中的智能体,以及将分配任务求解器作为强化学习中的环境;将策略函数确定的超参数作为强化学习中的动作,以使得分配任务求解器基于超参数对第一集合中的多个分配任务进行求解得到求解结果,以及基于求解结果计算与强化学习对应的状态和奖励,并以最大化奖励为优化目标,对策略函数进行强化学习训练;基于训练完成后的策略函数,确定分配任务求解器的目标超参数。