-
公开(公告)号:CN119578452A
公开(公告)日:2025-03-07
申请号:CN202411655649.7
申请日:2024-11-19
Applicant: 北京邮电大学
IPC: G06N3/006 , G06N3/0442 , G06N3/092
Abstract: 本发明公开了一种基于通用合作知识的多智能体协作方法,包括以下步骤:确定任务领域,并选取若干个合作任务;构建多任务训练框架,所述训练框架包括为每一个合作任务设置的感知网络和决策网络,所述决策网络包括共享决策层和任务特定决策层;基于每一个合作任务,对所述多任务训练框架进行训练,基于训练后的决策网络,构建任务共享决策网络模型;将所述任务共享决策网络模型迁移到新的任务领域中进行训练,完成当前任务中多智能体的协作。本发明采用一种多任务的学习方法,通过将学得的共享策略网络应用于其它相同或不同领域的合作任务中进行训练,促进智能体之间的协作和协调。
-
公开(公告)号:CN118052272B
公开(公告)日:2024-11-01
申请号:CN202410189439.7
申请日:2024-02-20
Applicant: 北京邮电大学
IPC: G06N3/092 , G06N20/00 , G06N3/042 , G06F18/23 , G06F18/2413
Abstract: 本公开提供了一种多智能体强化学习方法及装置、电子设备、存储介质,属于超图表示学习技术领域,该方法包括:基于多智能体系统中各个智能体的观测信息生成多条超边。每条超边连接多个智能体,多条超边组成超图结构。超图结构为多智能体系统对应的通信结构。基于各个智能体的观测信息计算多智能体之间的消息权重。基于通信结构和消息权重生成多智能体系统对应的关联度。基于关联度对各个智能体的通信信息进行融合,得到每个智能体对应的融合通信信息。融合通信信息用于指导对应智能体的动作。本公开提供的多智能体强化学习方法及装置、电子设备、存储介质能对多个来自不同智能体的异构信息进行通信融合。
-
公开(公告)号:CN103539087B
公开(公告)日:2015-10-28
申请号:CN201310503669.8
申请日:2013-10-23
Applicant: 北京邮电大学
IPC: C01B21/072
Abstract: 本发明涉及一种制备氮化铝纳米线的方法,步骤如下:先将气相氧化铝和还原碳粉用研磨混合均匀后放置到同一个圆柱形容器中。将镀金硅衬底的镀金表面倒扣向下放置在容器盖的圆形孔洞上。在氮化铝纳米线生长过程中,先将容器放在立式管式炉正中间位置。然后将腔体抽真空后,通入一定量的氨气和氩气的混合气体,混合气的流量为100-300标准毫升/分钟。最后将炉温以30-60℃/分钟升至1100~1400℃温度范围,并保温20-120分钟。最后将容器温度降至室温,取出样品,在硅衬底表面有一层白色的沉积物即为氮化铝纳米线。本发明采用升华夹层法制备的氮化铝纳米线,工艺简单易操作,成本低,效率高,制得的产物纯度高。
-
公开(公告)号:CN103539087A
公开(公告)日:2014-01-29
申请号:CN201310503669.8
申请日:2013-10-23
Applicant: 北京邮电大学
IPC: C01B21/072
Abstract: 本发明涉及一种制备氮化铝纳米线的方法,步骤如下:先将气相氧化铝和还原碳粉用研磨混合均匀后放置到同一个圆柱形容器中。将镀金硅衬底的镀金表面倒扣向下放置在容器盖的圆形孔洞上。在氮化铝纳米线生长过程中,先将容器放在立式管式炉正中间位置。然后将腔体抽真空后,通入一定量的氨气和氩气的混合气体,混合气的流量为100-300标准毫升/分钟。最后将炉温以30-60℃/分钟升至1100~1400℃温度范围,并保温20-120分钟。最后将容器温度降至室温,取出样品,在硅衬底表面有一层白色的沉积物即为氮化铝纳米线。本发明采用升华夹层法法制备的氮化铝纳米线,工艺简单易操作,成本低,效率高,制得的产物纯度高。
-
公开(公告)号:CN119623566A
公开(公告)日:2025-03-14
申请号:CN202411723421.7
申请日:2024-11-28
Applicant: 北京邮电大学
IPC: G06N3/092 , G06N3/0499 , G06F18/23
Abstract: 本发明公开了一种基于涌现混合专家模型的多任务强化学习方法,包括以下步骤:构建多任务强化学习网络,所述多任务强化学习网络包括若干个前馈神经网络,每个前馈神经网络前面连接一个路由网络;对每个前馈神经网络进行聚类分析,均分为若干个专家模块;基于策略梯度下降方法对每个路由网络进行训练,并更新对应专家模块的参数;选取多任务学习环境中的实验任务;对于每个实验任务,基于训练后的路由网络激活对应的专家模块进行解耦处理,完成多任务强化学习。本发明为多任务学习提供了高效稳定的优化策略,有效缓解了多任务学习中参数共享与任务之间相互干扰的难题。
-
公开(公告)号:CN118052272A
公开(公告)日:2024-05-17
申请号:CN202410189439.7
申请日:2024-02-20
Applicant: 北京邮电大学
IPC: G06N3/092 , G06N20/00 , G06N3/042 , G06F18/23 , G06F18/2413
Abstract: 本公开提供了一种多智能体强化学习方法及装置、电子设备、存储介质,属于超图表示学习技术领域,该方法包括:基于多智能体系统中各个智能体的观测信息生成多条超边。每条超边连接多个智能体,多条超边组成超图结构。超图结构为多智能体系统对应的通信结构。基于各个智能体的观测信息计算多智能体之间的消息权重。基于通信结构和消息权重生成多智能体系统对应的关联度。基于关联度对各个智能体的通信信息进行融合,得到每个智能体对应的融合通信信息。融合通信信息用于指导对应智能体的动作。本公开提供的多智能体强化学习方法及装置、电子设备、存储介质能对多个来自不同智能体的异构信息进行通信融合。
-
公开(公告)号:CN103541010B
公开(公告)日:2016-04-13
申请号:CN201310504652.4
申请日:2013-10-23
Applicant: 北京邮电大学
Abstract: 本发明涉及一种铒掺杂硼酸铝纳米线的制备方法,采用固相合成的方法,步骤如下:称取一定摩尔比范围的反应物氧化铝、硼酸和氯化铒(III)六水合物,然后用常规方法将上述反应物混合粉碎。将混合的反应物放入到管式炉中心位置,然后将腔体抽真空后,通入一定量的氧气和氩气的混合气体(氧气与氩气的摩尔比范围为1:2~2:1之间),混合气的流量为50~200标准毫升/分钟。最后将炉温以20~60℃/分钟升至温度范围1100~1350℃,并保温60~300分钟。然后将管式炉温度降至室温,取出样品,所得产物为铒掺杂硼酸铝纳米线。本发明方法工艺简单易操作,成本低,效率高,制备的产物纯度高。
-
公开(公告)号:CN103541010A
公开(公告)日:2014-01-29
申请号:CN201310504652.4
申请日:2013-10-23
Applicant: 北京邮电大学
Abstract: 本发明涉及一种铒掺杂硼酸铝纳米线的制备方法,采用固相合成的方法,步骤如下:称取一定摩尔比范围的反应物氧化铝、硼酸和氯化铒(III)六水合物,然后用常规方法将上述反应物混合粉碎。将混合的反应物放入到管式炉中心位置,然后将腔体抽真空后,通入一定量的氧气和氩气的混合气体(氧气与氩气的摩尔比范围为1:2~2:1之间),混合气的流量为50~200标准毫升/分钟。最后将炉温以20~60℃/分钟升至温度范围1100~1350℃,并保温60~300分钟。然后将管式炉温度降至室温,取出样品,所得产物为铒掺杂硼酸铝纳米线。本发明方法工艺简单易操作,成本低,效率高,制备的产物纯度高。
-
-
-
-
-
-
-