一种基于集成的合作多智能体深度强化学习方法

    公开(公告)号:CN116468107A

    公开(公告)日:2023-07-21

    申请号:CN202310453463.2

    申请日:2023-04-25

    Inventor: 徐鼎 赵岭忠

    Abstract: 本发明公开了一种基于集成的合作多智能体深度强化学习方法,包括如下步骤:步骤1、演员评论家网络或者动作值网络的初始化;步骤2、获取局部观察;步骤3、合作多智能体系统在环境中的决策;步骤4、抽取转移样本;步骤5、训练演员评论家网络或者动作值网络;步骤6、重复步骤2‑5,直至训练结束。这种方法为每个智能体集成多个策略网络或者动作值网络,使得智能体依据能多个策略网络或者动作值网络集成的输出进行决策,以提升智能体决策的鲁棒性。该方法为集成的多个策略网络或者动作值网络使用不同的样本训练进行训练,保证了它们的多样性。有效提升智能体决策的鲁棒性,同时还具有良好的适用性。

    一种基于时空融合的物联网缺失数据补全方法

    公开(公告)号:CN113554105B

    公开(公告)日:2023-04-18

    申请号:CN202110856334.9

    申请日:2021-07-28

    Abstract: 本发明公开了一种基于时空融合的物联网缺失数据补全方法,通过收集物联网传感器的时序数据,得到传感器的历史数据,对离线的传感器的历史数据进行统计分析,分析传感器数据的缺失情况;数据空间关系感知:采用标准化互信息的方法挖掘收集到的传感器的历史数据之间的关系,计算任意两个传感器历史数据之间的相关系数,并选择相关系数大于0.5的数据作为待补全传感器的空间关系数据;构建并训练关系感知LSTM模型;将采集到的不完整的传感器数据输入训练好的Ra‑LSTM模型中进行数据补全,得到完整的数据集。该方法既利用传感器自身的历史时序数据又利用传感器之间的空间关系数据;补全融合的方法,补全结果更准确;在多个传感器数据同时缺失的条件下同样适用。

    一种基于多智能体系统的深度强化学习方法

    公开(公告)号:CN115048973A

    公开(公告)日:2022-09-13

    申请号:CN202210325495.X

    申请日:2022-03-29

    Abstract: 本发明公开了一种基于多智能体系统的深度强化学习方法,包括如下步骤:基于结合体框架建立算法,多智能体系统中每个独立的智能体均为分类的诱发条件,智能体触发诱发条件,判断该智能体的观测范围内所有智能体能否成为合作者,当触发诱发条件的智能体观测范围内具有成为合作者的智能体时,将其构成组,建立双向的LSTM模型,并整合每个上述的通信组中所有智能体的信息,促成协作决策,智能体同时属于至少两个通信组时,建立通信通道连接该智能体所在的通信组;本方案应用在具有较多智能体的多智能体系统中,可在其判断哪些智能体摄取的信息是有价值的,避免将这些没有价值的信息带入系统中时,降低了系统的运算量,极大地增加了通信的速率。

    基于粗糙集理论与规则相结合的智能家居数据补全方法

    公开(公告)号:CN111856954B

    公开(公告)日:2022-08-02

    申请号:CN202010699554.0

    申请日:2020-07-20

    Abstract: 本发明公开一种基于粗糙集理论与规则相结合的智能家居数据补全方法,使用粗糙集属性约简算法将冗余信息去除,避免多于信息对数据补全产生。粗糙集理论使用信息熵的概念,能够发现数据之间潜在关系,而不是简单的数据之间线性关系。根据约简结果形成的规则符合决策系统中行为习惯,缺省推理允许信息在不完全情况下做出合适的推理,符合现实推理需求。粗糙集理论将连续数据离散化处理,在智能家居决策系统中,系统不需要准确数据,只需要传感器达到某个范围内就能做出决策,因此本方法能够实现智能家居决策系统中缺失值补全,提高决策系统的可靠性和准确性,提供良好的用户体验。

    多智能体系统任务规划方法

    公开(公告)号:CN108830483B

    公开(公告)日:2021-11-23

    申请号:CN201810622143.4

    申请日:2018-06-15

    Abstract: 本发明公开一种多智能体系统任务规划方法,利用多智能体系统模型,引入正交交叉差分进化算法对系统当中任务进行有效的规划。与现有技术相比,本发明提出的多智能体系统规划方法效率明显,精确度更高,可靠性更强,能够有效的为多智能体系统节省工作工作时间。

    时间多栈下推网络的动态转换方法

    公开(公告)号:CN105260296B

    公开(公告)日:2018-08-14

    申请号:CN201510581423.1

    申请日:2015-09-14

    Abstract: 本发明公开一种时间多栈下推网络的动态转换方法,首先,在MPDN的基础上引入时钟,提出TMPDN模型,并给出其语法及操作语义;其次,利用时钟域等价的优化技术,通过动态转换方法,将连续时间的TMPDN模型转换成离散的多栈下推网络模型。本发明能够实现同时实现实时并发系统的实时性和并发性的描述,并能为实时并发程序的形式化验证提供保证。

    时间多栈下推网络的动态转换方法

    公开(公告)号:CN105260296A

    公开(公告)日:2016-01-20

    申请号:CN201510581423.1

    申请日:2015-09-14

    Abstract: 本发明公开一种时间多栈下推网络的动态转换方法,首先,在MPDN的基础上引入时钟,提出TMPDN模型,并给出其语法及操作语义;其次,利用时钟域等价的优化技术,通过动态转换方法,将连续时间的TMPDN模型转换成离散的多栈下推网络模型。本发明能够实现同时实现实时并发系统的实时性和并发性的描述,并能为实时并发程序的形式化验证提供保证。

    一种基于目标Q值修正的合作多智能体深度Q学习方法

    公开(公告)号:CN116468108A

    公开(公告)日:2023-07-21

    申请号:CN202310453542.3

    申请日:2023-04-25

    Inventor: 徐鼎 赵岭忠

    Abstract: 本发明公开了一种基于目标Q值修正的合作多智能体深度Q学习方法,包括如下步骤:步骤1、Q网络和混合网络的构建与初始化;步骤2、智能体在环境中探索并收集转移样本;步骤3、抽取转移样本;步骤4、重置高估Q网络、低估Q网络、高估混合网络和低估混合网络的参数;步骤5、训练高估Q网络;步骤6、训练低估Q网络;步骤7、训练原始Q网络;步骤8、调整高估偏差系数和低估偏差系数;步骤9、重复步骤2‑步骤8,直至训练结束。这种方法为具有不同偏差程度的原始目标Q值计算出相应的修正量,有效解决目标Q值的估计偏差问题,并提升合作多智能体系统的性能。

    一种面向电力缺失数据的协同补全方法

    公开(公告)号:CN113554106B

    公开(公告)日:2022-03-18

    申请号:CN202110856338.7

    申请日:2021-07-28

    Abstract: 本发明公开了一种面向电力缺失数据的协同补全方法,通过采集电力数据,并对采集到的数据进行分析,统计电力数据的缺失情况;采用自相分析的方法分析数据列自身的前后关系,挖掘数据列自身的隐式关系,为电力数据的属性列选择合适步长的历史样本,作为待插补电力数据的历史样本;采用互相关分析的方法分析不同数据列之间的相关关系,挖掘不同数据列的隐式关系,为电力数据的属性列筛选出相关系数大于0.5的数据列,并将其作为待插补电力数据的关系数据;建立补全模型HR‑LSTM并对模型进行训练,将采集到有缺失的电力数据输入训练好的补全模型HR‑LSTM中,即可得到补全了缺失值的电力数据。该方法数据补全效果好,效率高。

    一种面向实时视频流的边缘环境行为识别系统

    公开(公告)号:CN113591674A

    公开(公告)日:2021-11-02

    申请号:CN202110856044.4

    申请日:2021-07-28

    Abstract: 本发明公开了一种面向实时视频流的边缘环境行为识别系统,包括视频流获取模块、视频流存储模块、视频流预处理模块、缓存模块、滑窗定位模块、行为识别模块和用户界面模块;滑窗定位模块基于弹性跳跃滑窗的动作启动在线检测方法通过定位动作发生的位置节省了大量的计算资源,同时,并没有因为放弃滑动窗口的逐帧滑动致使原本性能优良的模型的检测性能产生较大的损失,在一定程度上实现了模型轻量化效果,避免大量无效数据送入行为识别模块,提高了行为识别的效率,提高了识别的实时性,通过数据本地化处理,更好得保护了敏感场景下边缘设备获取到的数据的隐私安全问题,该系统相较于普遍基于云中心的行为识别服务更有利于资源受限的边缘设备使用。

Patent Agency Ranking