-
公开(公告)号:CN119886272A
公开(公告)日:2025-04-25
申请号:CN202510067613.5
申请日:2025-01-16
IPC: G06N3/092 , G06N3/096 , G06N3/045 , G06N3/0464 , G06F18/22
Abstract: 本发明公开了一种针对高动态决策场景智能体探索的强化学习系统及方法,包括正演员‑评论家模型、负演员‑评论家模型、演员‑评论家模型、策略相似度模型和策略动作选择模型,通过使用正向策略和负向策略指导主策略的学习,同时最小化主策略与正向策略的接近程度和最大化主策略与负向策略的接近程度,让主策略以高概率产生高价值动作,低概率产生低价值动作,提升方法的整体性能;同时,在训练过程中通过策略动作选择模型以概率形式选择执行主策略动作、正向策略动作、负向策略动作,增加动作选择的多样性,间接提高探索环境的多样性,最终实现性能提升。
-
公开(公告)号:CN118966647A
公开(公告)日:2024-11-15
申请号:CN202411005425.1
申请日:2024-07-25
Applicant: 东南大学
IPC: G06Q10/0631 , G06N5/04 , G06N3/042 , G06N3/092 , G06N3/044
Abstract: 本发明提出了一种针对高动态博弈场景中无人机群体的辅助任务截止时间特性的任务分配方法。该方法旨在解决辅助任务超时消失对系统稳定性的影响。辅助任务在截止时间前完成可加速其他任务的完成。在高动态博弈场景下,辅助任务的作用范围并不确定,辅助任务之间的级联扩散影响也不确定,增大了问题的复杂度。本发明首先对任务进行时间编码,生成特征向量;然后计算任务截止优先级并更新智能体特征;最后应用多智能体系统决策学习进行任务分配。与现有方法相比,本发明通过时间编码和截止优先级的计算,结合注意力机制,有效提升了任务完成率和系统在复杂博弈环境中的存活率。
-
公开(公告)号:CN118966646A
公开(公告)日:2024-11-15
申请号:CN202411005417.7
申请日:2024-07-25
Applicant: 东南大学 , 北京京航计算通讯研究所
IPC: G06Q10/0631 , G06N5/04 , G06N3/0442 , G06N3/042 , G06N3/092
Abstract: 本发明提供了一种针对无人机群中辅助任务不确定到达时间特性的任务目标分配方法,以解决大规模混杂智能无人机群体面对周期性到达的辅助任务决策时的局部最优性问题。在高动态博弈场景中,智能无人机群体需要执行的任务分为主要任务与辅助任务,辅助任务完成可以对主要任务起辅助作用,降低其执行时间。面对实际对抗环境中辅助任务的到达时间与影响范围不确定的情况,提出以下方法。首先,该方法构建任务之间的注意力模型为任务计算特征向量;其次,任务的到达时间等属性结合构建智能体和任务之间的注意力模型;最后,使用分层强化学习的方法对任务进行分配处理。本方法加快了任务整体的完成时间,提高了系统的存活率。
-
公开(公告)号:CN106886603B
公开(公告)日:2020-07-14
申请号:CN201710123249.5
申请日:2017-03-03
Applicant: 东南大学
IPC: G06F16/2458 , G06F30/20
Abstract: 本发明公开了一种需求响应资源组合优化的分层分布式体系架构和方法,该体系架构包括负荷聚合商,负荷代理和需求响应资源;其中,负荷代理是一组需求响应资源的等值,其获取需求响应资源的相关信息,并将负荷聚合商下达的控制信息传递给需求响应资源;各负荷代理之间通过通信网络交互负荷聚合商公布的信息和其他负荷代理的信息。该方法简化了计算的复杂性;便于负荷聚合商的管理,也为大量的中小型需求响应资源参与系统调度提供了可能;利用一致性算法和Dantzig‑Wolfe分解理论对负荷调整量分配问题进行分布式计算,相比集中式优化提高了计算的速度,而且可以适应需求响应资源不确定性的特性。
-
公开(公告)号:CN118700136A
公开(公告)日:2024-09-27
申请号:CN202410846471.8
申请日:2024-06-27
Applicant: 东南大学
IPC: B25J9/16
Abstract: 本发明公开了一种用于圆形墩柱水下巡检抱爬式机器人的纠偏装置及纠偏方法,用于水下抱爬式机器人的自动纠偏;纠偏装置包括机身本体、伺服动力系统、从动轮、被动纠偏模块、同步拉伸固定系统以及倾角测量模块。纠偏方法包括被动纠偏方法以及主动纠偏方法,其中被动纠偏方法利用被动纠偏模块在机架发生竖直方向偏转时通过弹簧弹力辅助纠偏;主动纠偏方法则通过解析倾角测量模块提供的数据,调整伺服动力系统来精确控制机器人在水下的运动方向和角度,以保证高效、稳定的巡检操作。本发明的纠偏方法结合被动物理机制和主动控制策略,可在高流速、浑浊的水下环境中进行精准的自动纠偏,显著提高了水下机器人在复杂环境中的操作稳定性和自适应能力。
-
公开(公告)号:CN106886603A
公开(公告)日:2017-06-23
申请号:CN201710123249.5
申请日:2017-03-03
Applicant: 东南大学
Abstract: 本发明公开了一种需求响应资源组合优化的分层分布式体系架构和方法,该体系架构包括负荷聚合商,负荷代理和需求响应资源;其中,负荷代理是一组需求响应资源的等值,其获取需求响应资源的相关信息,并将负荷聚合商下达的控制信息传递给需求响应资源;各负荷代理之间通过通信网络交互负荷聚合商公布的信息和其他负荷代理的信息。该方法简化了计算的复杂性;便于负荷聚合商的管理,也为大量的中小型需求响应资源参与系统调度提供了可能;利用一致性算法和Dantzig‑Wolfe分解理论对负荷调整量分配问题进行分布式计算,相比集中式优化提高了计算的速度,而且可以适应需求响应资源不确定性的特性。
-
公开(公告)号:CN221320664U
公开(公告)日:2024-07-12
申请号:CN202322663514.2
申请日:2023-09-28
Applicant: 中铁十五局集团第四工程有限公司 , 东南大学
IPC: E01D21/00
Abstract: 本实用新型公开了一种承插支架结构,由模板立杆、横杆、纵杆、竖杆、L型支托、竖杆底座和插销组成。模板立杆与横杆相互垂直焊接连接;竖杆插在焊接在横杆端部的竖杆底座上,通过插销连接;L型支托分别焊接在模板立杆和竖杆上,纵杆搁置在L型支托上。模板立杆、横杆、纵杆、竖杆可为方钢管、圆钢管或者其他类型的型钢,L型支托为角钢;相邻的横杆间搭设施工平台搭板。本实用新型各部件相互插接或搭接搁置而形成支架结构,可以承受混凝土浇筑时的人工和机械荷载,施工人员可以在搭设的施工平台搭板上行走,具有承载力大、杆件间相互组合便利,施工便捷、重复利用率高,使用范围广等优点。
-
-
-
-
-
-