强化学习模型的训练方法、装置、电子设备及存储介质

    公开(公告)号:CN117993473A

    公开(公告)日:2024-05-07

    申请号:CN202410237664.3

    申请日:2024-03-01

    Abstract: 本申请提出一种强化学习模型的训练方法、装置、电子设备及存储介质,其中,方法包括:将第一时刻下的样本状态数据输入至PID控制器,由PID控制器输出样本第一动作;获取样本第一动作的样本奖励数据;对第一时刻下的样本状态数据、样本第一动作和样本第一动作的样本奖励数据进行关联,得到第一训练样本;将第一训练样本添加到智能体的强化学习模型的经验池;从经验池中筛选出目标训练样本,并基于目标训练样本,对强化学习模型进行训练。由此,可基于PID控制器生成第一训练样本,并将第一训练样本添加到经验池,以对强化学习模型进行训练,加快了强化学习模型的收敛速度,可自动生成大量的第一训练样本,提高了强化学习模型的鲁棒性。

    线束总成
    9.
    实用新型

    公开(公告)号:CN221633362U

    公开(公告)日:2024-08-30

    申请号:CN202322926355.0

    申请日:2023-10-30

    Abstract: 本公开实施例提供一种线束总成,包括穿墙件和连接线束;穿墙件包括穿墙本体和固定配合件;穿墙本体的端部设置有与固定配合件连接的配合部;穿墙本体的中间区域设置有线束通孔;连接线束包括线束本体和设置在线束本体两端的线束接口;线束本体穿过线束通孔,并且设置在线束本体两端的线束接口分别位于线束通孔的两侧;穿墙件还包括填充线束通孔中缝隙的密封胶。采用密封胶填充线束通孔中的缝隙,使得线束通孔完全密封并实现线束本体相对于穿墙本体的固定,可以避免粉尘通过缝隙进入到设备舱,并避免线束本体在线束通孔内的磨损。

    线束总成
    10.
    实用新型

    公开(公告)号:CN221633361U

    公开(公告)日:2024-08-30

    申请号:CN202322926281.0

    申请日:2023-10-30

    Abstract: 本公开实施例提供一种线束总成,包括穿墙件和第一线束;穿墙件包括穿墙本体和固定配合件;穿墙本体和固定配合件配合,用于将线束总成固定在设备墙板的墙板孔处;穿墙本体的中间区域设置有线束通孔;第一线束包括主线束体、多条支线束体、第一线束接口和多个第二线束接口;各条支线束体均与主线束体的第一端连接;第一线束接口设置在主线束体的第二端;第二线束接口设置在对应的支线束体的自由端;主线束体穿过线束通孔。通过将多条支线束体与主线束体的第一端连接,仅将第一线束的主线束体穿过线束通孔,没有将各条与传感器连接的支线束体穿过线束通孔,可以避免过多与传感器连接的支线束体穿过线束通孔造成的通孔尺寸不足的问题。

Patent Agency Ranking