基于博弈的Q学习竞争窗口调整方法、系统及介质

    公开(公告)号:CN112637965B

    公开(公告)日:2022-06-10

    申请号:CN202011620219.3

    申请日:2020-12-30

    Inventor: 俞晖 毛中杰 王政

    Abstract: 本发明提供了一种基于博弈的Q学习竞争窗口调整方法、系统及介质,包括:步骤1:初始化网络节点设置,进行自组网并建立路由表;步骤2:全网节点通过路由表获知一跳邻居节点个数,并广播至邻居节点;步骤3:计算节点在网络中的权重大小并进行广播;步骤4:根据网络差异性采取不同退避策略;步骤5:网络中各节点按照步骤4产生的竞争窗口状态集合进行Q学习,输出最优竞争窗口区间,并依此进行通信;步骤6:网络拓扑结构发生改变或业务负载产生较大波动后,重复执行步骤2‑5。本发明使用博弈论对网络场景进行分析,确定不同节点进行Q学习的状态集合,然后利用Q学习算法产生决策,更新竞争窗口区间,以达到优化整体网络性能的大小。

    空天地一体化网络中时延最小化计算任务卸载方法及系统

    公开(公告)号:CN113346944A

    公开(公告)日:2021-09-03

    申请号:CN202110720194.2

    申请日:2021-06-28

    Abstract: 本发明提供了一种空天地一体化网络中时延最小化计算任务卸载方法及系统,包括:步骤S1:建立支持计算任务卸载的空天地一体化网络的网络架构;步骤S2:基于空天地一体化网络的网络架构构建空天地一体化网络模型;步骤S3:基于构建的空天地一体化网络模型建立面向时延最小的优化问题;步骤S4:将优化问题建模为马尔科夫决策过程;步骤S5:采用CL‑MADDPG算法求解马尔科夫决策过程,输出卸载策略。本发明可以充分利用空天地一体化网络中的计算资源,输出计算任务最优卸载策略,减少计算任务的处理时延。

    一种具有贯通型介孔的氮掺杂花型碳纳米材料及制备方法

    公开(公告)号:CN108899557B

    公开(公告)日:2020-11-06

    申请号:CN201810577050.4

    申请日:2018-06-07

    Abstract: 本发明涉及应用在燃料电池中催化氧还原反应材料领域,公开了一种具有贯通型介孔的氮掺杂花型碳纳米材料,材料的微观形貌为纳米花,且所述纳米花内具有贯通型介孔。本发明还公开了这种具有贯通型介孔的氮掺杂花型碳纳米材料的制备方法,采用Ni2+‑Mn3+衍生层状双层金属氢氧化物纳米花为自牺牲模板、PS‑b‑PEO在溶液中自组装形成的球形胶束为介孔软模板、及间苯二胺为碳前驱体,通过聚合反应制备得到花型纳米复合材料,经过清洗、干燥后,进行气氛煅烧制得。本具有贯通型介孔的氮掺杂花型碳纳米材料为三维结构,具有高材料比表面积,能提高传质效率,具有高氧还原催化性能,且介孔不易堵塞,维持材料性能,还制备方法简单易得。

    一种具有贯通型介孔的氮掺杂花型碳纳米材料及制备方法

    公开(公告)号:CN108899557A

    公开(公告)日:2018-11-27

    申请号:CN201810577050.4

    申请日:2018-06-07

    CPC classification number: H01M4/9091 B82Y30/00 B82Y40/00

    Abstract: 本发明涉及应用在燃料电池中催化氧还原反应材料领域,公开了一种具有贯通型介孔的氮掺杂花型碳纳米材料,材料的微观形貌为纳米花,且所述纳米花内具有贯通型介孔。本发明还公开了这种具有贯通型介孔的氮掺杂花型碳纳米材料的制备方法,采用Ni2+-Mn3+衍生层状双层金属氢氧化物纳米花为自牺牲模板、PS-b-PEO在溶液中自组装形成的球形胶束为介孔软模板、及间苯二胺为碳前驱体,通过聚合反应制备得到花型纳米复合材料,经过清洗、干燥后,进行气氛煅烧制得。本具有贯通型介孔的氮掺杂花型碳纳米材料为三维结构,具有高材料比表面积,能提高传质效率,具有高氧还原催化性能,且介孔不易堵塞,维持材料性能,还制备方法简单易得。

    基于博弈的Q学习竞争窗口调整方法、系统及介质

    公开(公告)号:CN112637965A

    公开(公告)日:2021-04-09

    申请号:CN202011620219.3

    申请日:2020-12-30

    Inventor: 俞晖 毛中杰 王政

    Abstract: 本发明提供了一种基于博弈的Q学习竞争窗口调整方法、系统及介质,包括:步骤1:初始化网络节点设置,进行自组网并建立路由表;步骤2:全网节点通过路由表获知一跳邻居节点个数,并广播至邻居节点;步骤3:计算节点在网络中的权重大小并进行广播;步骤4:根据网络差异性采取不同退避策略;步骤5:网络中各节点按照步骤4产生的竞争窗口状态集合进行Q学习,输出最优竞争窗口区间,并依此进行通信;步骤6:网络拓扑结构发生改变或业务负载产生较大波动后,重复执行步骤2‑5。本发明使用博弈论对网络场景进行分析,确定不同节点进行Q学习的状态集合,然后利用Q学习算法产生决策,更新竞争窗口区间,以达到优化整体网络性能的大小。

    基于Q学习的深度神经网络自适应退避策略实现方法及系统

    公开(公告)号:CN111867139A

    公开(公告)日:2020-10-30

    申请号:CN202010640594.8

    申请日:2020-07-06

    Abstract: 本发明提供了一种基于Q学习的深度神经网络自适应退避策略实现方法及系统,包括:步骤1:对无人机网络中的网络节点和网络拓扑结构进行初始化,确定树形网络的簇头节点,对退避策略参数初始化后,广播至全网节点;步骤2:全网节点根据初始化后的退避策略参数来更新本地的退避策略;步骤3:簇头节点根据收到的更新信息进行统计,得出网络公平性指标并形成向量,保存进经验池中;步骤4:簇头节点从经验池中提取向量,输入到深度神经网络进行训练,得到真实Q值,将真实Q值与预测Q值进行对比;步骤5:返回步骤2继续执行,当学习策略趋于稳定符合预设条件时,输出退避策略。本发明提高了无人机节点在动态变化网络场景中的通信性能。

Patent Agency Ranking