针对高动态决策场景智能体探索的强化学习系统及方法

    公开(公告)号:CN119886272A

    公开(公告)日:2025-04-25

    申请号:CN202510067613.5

    申请日:2025-01-16

    Abstract: 本发明公开了一种针对高动态决策场景智能体探索的强化学习系统及方法,包括正演员‑评论家模型、负演员‑评论家模型、演员‑评论家模型、策略相似度模型和策略动作选择模型,通过使用正向策略和负向策略指导主策略的学习,同时最小化主策略与正向策略的接近程度和最大化主策略与负向策略的接近程度,让主策略以高概率产生高价值动作,低概率产生低价值动作,提升方法的整体性能;同时,在训练过程中通过策略动作选择模型以概率形式选择执行主策略动作、正向策略动作、负向策略动作,增加动作选择的多样性,间接提高探索环境的多样性,最终实现性能提升。

    一种针对无人机群体中辅助任务截止时间的任务分配方法

    公开(公告)号:CN118966647A

    公开(公告)日:2024-11-15

    申请号:CN202411005425.1

    申请日:2024-07-25

    Applicant: 东南大学

    Abstract: 本发明提出了一种针对高动态博弈场景中无人机群体的辅助任务截止时间特性的任务分配方法。该方法旨在解决辅助任务超时消失对系统稳定性的影响。辅助任务在截止时间前完成可加速其他任务的完成。在高动态博弈场景下,辅助任务的作用范围并不确定,辅助任务之间的级联扩散影响也不确定,增大了问题的复杂度。本发明首先对任务进行时间编码,生成特征向量;然后计算任务截止优先级并更新智能体特征;最后应用多智能体系统决策学习进行任务分配。与现有方法相比,本发明通过时间编码和截止优先级的计算,结合注意力机制,有效提升了任务完成率和系统在复杂博弈环境中的存活率。

    多重网络化产业链中面向任务动态性的自适应任务迁移方法

    公开(公告)号:CN116610432A

    公开(公告)日:2023-08-18

    申请号:CN202310679849.5

    申请日:2023-06-07

    Applicant: 东南大学

    Abstract: 本发明提供了一种多重网络化产业链中面向任务动态性的自适应任务迁移方法,以解决其在生产过程中存在的层内、层间负载不均衡问题。首先,该方法将多重网络化产业链上的生产单元建模为智能体,并从每个网络层中选择关键智能体来相互合作;其次,为了实现网络层之间的负载均衡,被选中的关键智能体以集中式的形式将任务向目标网络层迁移;最后,为了实现每个网络层内的负载均衡,被级联触发的智能体会以分布式的形式将任务向网络层内其余的智能体迁移。与传统的单一网络化任务迁移方法相比,本方法结合了集中式和分布式任务迁移的优点,在保证任务迁移灵活性的前提下,利用整体状态信息,更好地维持系统的稳定性和高效性。

    一种针对大宗商品交易市场监管资源调配的智能化人机协作调度方法与系统

    公开(公告)号:CN113283692A

    公开(公告)日:2021-08-20

    申请号:CN202110296445.9

    申请日:2021-03-19

    Applicant: 东南大学

    Abstract: 本发明公开了一种针对大宗商品交易市场监管资源调配的智能化人机协作调度方法与系统,根据任务需求对人、机资源进行智能化实时调度分配以提高任务完成率至关重要,当任务到达时,任务处理模块根据任务不同环节构成的拓扑图关系进行部分关键路径集合的求解和截止时间的分配计算,得到任务待执行队列和任务池;之后,通过资源调度模块进行人、机资源的智能化实时分配,输出任务的执行次序和具体开始时间;根据任务实时反馈的执行信息自动调整调度分配策略,使得尽可能多的任务在截止时间前完成。该调度方法兼顾任务执行不确定性的影响,与以往“先来先服务”、分配单一固定的方式相比,具有调度计划鲁棒性高、任务延期风险低的优点。

    一种基于反向拍卖模型的大宗商品交易数据共享激励方法和系统

    公开(公告)号:CN113112360A

    公开(公告)日:2021-07-13

    申请号:CN202110361421.7

    申请日:2021-04-02

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于反向拍卖模型的大宗商品交易数据共享激励方法和系统,采用反向拍卖模型来解决在交易平台向综合服务平台进行交易数据共享的过程如何为交易数据定价的问题,综合服务平台通过任务管理模块来发起数据拍卖活动;交易平台通过查询请求模块选择符合条件的数据拍卖活动进行竞拍,提交竞拍标的;综合服务平台通过激励机制模块计算此次拍卖活动中获胜的交易平台来实现收益的最大化,并计算获胜的交易平台得到的积分;获胜的交易平台通过数据管理模块上传进行竞拍的交易数据,本发明保证了综合服务平台的收益最大化,在多项式时间内计算出竞拍结果,同时保证了交易平台的非亏损性,能够有效地激励交易平台向综合服务平台进行数据共享。

    一种大宗商品交易平台关联监管范围的自适应推荐方法与系统

    公开(公告)号:CN112926999A

    公开(公告)日:2021-06-08

    申请号:CN202110330979.9

    申请日:2021-03-26

    Applicant: 东南大学

    Abstract: 本发明公开了一种大宗商品交易平台关联监管范围的自适应推荐方法与系统,根据大宗商品交易平台中的历史交易数据,构建平台关联网络,并基于该网络进行平台之间的关联性划分,从而推荐合适的关联交易平台的监管范围。本方法适用于大宗商品电子商务交易市场的监管,通过分析在不同交易平台的共同交易用户的历史交易数据,并进行数据处理,形成具有平台主体间关联关系的复杂网络,接着通过全局社区发现算法,依据给社区带来的增益判断平台间的关联度,选择合适的社区,最终为监管部门监管某个交易平台时推荐与该交易平台关联密切的其他交易平台进行监管,本发明推荐合适的平台监管范围,提升了监管效率,达到优化监管的效果。

Patent Agency Ranking