-
公开(公告)号:CN119695986A
公开(公告)日:2025-03-25
申请号:CN202311246164.8
申请日:2023-09-25
Applicant: 京东城市(北京)数字科技有限公司
Abstract: 本发明公开了一种模型训练方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括获取历史数据集,包括多个处理单元在目标时间的多个用电数据;为每个处理单元生成对应的策略网络,以使用每个策略网络基于相应的用电数据,计算对应的实时储电数据,并对应更新每个处理单元的用电数据,得到样本数据集;调用预设的价值网络,以近似计算样本数据集对应的长期收益;调用预设的优势函数,以根据长期收益确定每个策略网络对应的上升梯度,从而对每个策略网络进行更新训练。从而,本发明的实施方式能够解决现有用电高峰电力调度效率低的技术问题。