针对多智能体的训练方法、装置、存储介质及电子设备

    公开(公告)号:CN113283601A

    公开(公告)日:2021-08-20

    申请号:CN202110564554.4

    申请日:2021-05-24

    Applicant: 吉林大学

    Abstract: 本申请实施例公开了一种针对多智能体的训练方法,涉及深度强化学习领域,所述方法包括:基于整合器和分布参数得到初始分布值函数;基于所述初始分布值函数和贝叶斯定理对所述分布参数进行更新,获取更新分布值函数;基于所述更新分布值函数和时间差分法对所述整合器进行更新,获取目标整合器,以及基于所述目标整合器获取目标分布值函数;基于所述目标分布值函数的采样情况对初始策略网络进行更新,获取目标策略网络。采用本申请实施例,可以提高针对多智能体的训练模型的鲁棒性和训练效率。

    一种时隙调度方法及簇头节点设备

    公开(公告)号:CN110401983A

    公开(公告)日:2019-11-01

    申请号:CN201910763412.3

    申请日:2019-08-19

    Applicant: 吉林大学

    Abstract: 本发明公开了一种时隙调度方法及簇头节点设备,簇头节点设备位于簇型拓扑结构的通信网络,通信网络包括至少一个成员节点设备,簇头节点设备可以根据当前通信周期内的成员节点设备发送的数据信息,将当前通信周期的下一通信周期中的可用时隙内的接收时隙分配给成员节点设备,再根据接收时隙和成员节点设备在当前通信周期的传播延迟,确定成员节点设备在当前通信周期的下一通信周期中的发送时隙,并将该发送时隙通知至成员节点设备。本发明采用调度各成员节点设备的发送时隙的技术手段,有效避免簇头节点设备接收多个成员节点设备发送数据时占用相同接收时隙的技术问题,降低簇头节点设备接收成员节点设备发送的数据时的冲突概率。

    基于多智能体强化学习的多路口交通信号灯公平控制方法

    公开(公告)号:CN118298648A

    公开(公告)日:2024-07-05

    申请号:CN202410269549.4

    申请日:2024-03-11

    Applicant: 吉林大学

    Abstract: 本发明属于智能交通控制技术领域,具体公开了基于多智能体强化学习的多路口交通信号灯公平控制方法,设计了一种新型的公平性度量指标,并提出了一种公平性感知的多智能体强化学习方法,可以在确保模型性能不受影响的前提下,提供相对公平的动作决策;提出了反事实数据增强的模块,通过利用反事实思想,基于已有的交互数据实现数据集的扩展,有利于丰富交互数据的多样性,进而在交互数据收集受限的任务中提高训练样本效率;设计了辅助自监督表示学习任务,通过状态之间天然的时序关系构建自监督表示学习损失,额外训练损失的引入有利于状态信息特征提取,提升模型训练样本效率。

    一种时隙调度方法及簇头节点设备

    公开(公告)号:CN110401983B

    公开(公告)日:2021-11-02

    申请号:CN201910763412.3

    申请日:2019-08-19

    Applicant: 吉林大学

    Abstract: 本发明公开了一种时隙调度方法及簇头节点设备,簇头节点设备位于簇型拓扑结构的通信网络,通信网络包括至少一个成员节点设备,簇头节点设备可以根据当前通信周期内的成员节点设备发送的数据信息,将当前通信周期的下一通信周期中的可用时隙内的接收时隙分配给成员节点设备,再根据接收时隙和成员节点设备在当前通信周期的传播延迟,确定成员节点设备在当前通信周期的下一通信周期中的发送时隙,并将该发送时隙通知至成员节点设备。本发明采用调度各成员节点设备的发送时隙的技术手段,有效避免簇头节点设备接收多个成员节点设备发送数据时占用相同接收时隙的技术问题,降低簇头节点设备接收成员节点设备发送的数据时的冲突概率。

    一种智能体训练方法、装置、存储介质及电子设备

    公开(公告)号:CN117540214A

    公开(公告)日:2024-02-09

    申请号:CN202311677765.4

    申请日:2023-12-07

    Applicant: 吉林大学

    Abstract: 本说明书公开了一种智能体训练方法、装置、存储介质及电子设备,其中方法包括:获取环境向量、智能体的局部状态向量和动作向量进行拼接,得到智能体的全局向量,采用对比模块对全局向量进行计算,得到目标向量,采用集成评价网络对目标向量进行评价得到样本评分,对样本评分进行处理得到预估评分,计算对比模块、策略网络和集成评价网络的损失函数,基于损失函数对网络参数进行调整,直至损失函数指示收敛,得到训练完成的对比模块、策略网络和集成评价网络,采用本说明书,采用对比模块辅助评价网络进行训练增加额外的损失函数,提高目标向量的表示能力,并通过集成式评价网络减少预估时产生的误差,提高了智能体训练模型的样本训练效率。

    一种数据处理方法及装置

    公开(公告)号:CN110516129B

    公开(公告)日:2022-07-01

    申请号:CN201910815231.0

    申请日:2019-08-30

    Applicant: 吉林大学

    Abstract: 本发明提供一种数据处理方法及装置,获取传感器采集的采集点处的海洋环境数据,采集点为预先确定,对海洋环境数据进行处理并分类,获得不同类别的海洋环境数据,按照不同类别将海洋环境数据存储于预先构建的时序数据库中对应不同类别的存储区中,预先构建的时序数据库中包括组件信息存储区和数据存储区,该组件信息存储区包括用于存储传感器基础信息的第一存储区,用于存储采集点基础信息的第二存储区,其中,数据存储区包括不同类别对应的存储区。利用构建的具有分布式结构的时序数据库,存储不同类别的海洋环境数据,解决了当用于集中式管理海洋环境数据的数据库出现损坏时,会导致出现整个数据库中的海洋环境数据都不能被用户调用的问题。

    一种数据处理方法及装置

    公开(公告)号:CN110601806A

    公开(公告)日:2019-12-20

    申请号:CN201910880582.X

    申请日:2019-09-18

    Applicant: 吉林大学

    Abstract: 本发明提供一种数据处理方法及装置,获取同一集群中每个节点对应的第一发送周期,第一发送周期用于指示第一节点向第二节点发送数据的时间,确定每个节点对应的第一发送周期是否重叠,若重叠,调整第一发送周期重叠的节点的发送周期,得到第二发送周期,集合每个节点当前对应的发送周期,构成调度时间表,其中,调度时间表中的发送周期之间互不重叠,发送周期包括第一发送周期、第二发送周期或第一发送周期和第二发送周期之间的组合,将调度时间表反馈给每个节点,使每个节点根据调度时间表中与自身对应的发送周期发送数据。解决多个节点在同一时间向同一个节点发送数据时,引起的信号冲突的问题,提高了数据的处理效率。

    一种AUV及目标跟踪方法、装置、介质

    公开(公告)号:CN110490909A

    公开(公告)日:2019-11-22

    申请号:CN201910796462.1

    申请日:2019-08-27

    Applicant: 吉林大学

    Abstract: 本申请公开了一种AUV及目标跟踪方法、装置、介质,包括:获取声学图像;确定所述声学图像中的目标对象;获取包括所述目标对象的光学图像;对所述声学图像中的所述目标对象和所述光学图像中的所述目标对象进行匹配,并利用匹配结果进行相应的目标跟踪。这样,在对目标对象进行匹配时,能够利用声学图像和光学图像共同完成匹配,从而提升了目标匹配和跟踪的精确度。

    基于灵活扩散卷积的图神经网络训练方法及相关设备

    公开(公告)号:CN119761446A

    公开(公告)日:2025-04-04

    申请号:CN202410879493.4

    申请日:2024-07-02

    Applicant: 吉林大学

    Abstract: 本申请公开了一种基于灵活扩散卷积的图神经网络训练方法及相关设备,该方法包括:获取包含节点标签的训练图数据;根据所述训练图数据的节点度信息确定每个节点的局部结构特征;利用扩散核函数处理所述局部结构特征得到每个节点的平滑特征;将所述平滑特征输入多层感知器得到每个节点的初步标签值,通过标签平滑处理所述初步标签值后得到每个节点的预测标签值;基于所述预测标签值和所述节点标签更新所述扩散核函数和所述多层感知器的参数,直至收敛或达到预定的训练轮数。本申请能够优化图神经网络模型的预测性能,提高鲁棒性和泛化性,提高对推荐系统等复杂图数据的标签预测准确率。

    一种数据处理方法及装置
    10.
    发明授权

    公开(公告)号:CN110601806B

    公开(公告)日:2021-05-18

    申请号:CN201910880582.X

    申请日:2019-09-18

    Applicant: 吉林大学

    Abstract: 本发明提供一种数据处理方法及装置,获取同一集群中每个节点对应的第一发送周期,第一发送周期用于指示第一节点向第二节点发送数据的时间,确定每个节点对应的第一发送周期是否重叠,若重叠,调整第一发送周期重叠的节点的发送周期,得到第二发送周期,集合每个节点当前对应的发送周期,构成调度时间表,其中,调度时间表中的发送周期之间互不重叠,发送周期包括第一发送周期、第二发送周期或第一发送周期和第二发送周期之间的组合,将调度时间表反馈给每个节点,使每个节点根据调度时间表中与自身对应的发送周期发送数据。解决多个节点在同一时间向同一个节点发送数据时,引起的信号冲突的问题,提高了数据的处理效率。

Patent Agency Ranking