-
公开(公告)号:CN119299365A
公开(公告)日:2025-01-10
申请号:CN202411575788.9
申请日:2024-11-06
Applicant: 北京交通大学
IPC: H04L45/121 , H04L45/00 , H04L45/302 , H04L47/125 , H04L47/10 , H04W28/08 , H04W40/02 , H04W40/24 , G06N3/006
Abstract: 本发明提供了一种基于强化免疫算法的TSN‑5G高铁车载网络流量调度方法。该方法包括:获取TSN‑5G高铁车载网中待调度流量集合的所有可能路由,以及每条路由的时延;设置强化免疫算法的各种算子,使用DQN网络作为强化免疫算法的克隆变异算子,以综合考虑时延与负载作为强化免疫算法的优化目标;强化免疫算法利用各种算子迭代求得每个流量的发送顺序和路由,以及每个流量在TSN交换机的发送时间;根据每个流量的发送时间得到TSN交换机的门控调度列表,TSN交换机根据门控调度列表对每个流量进行端到端的确定性传输。本发明方法通过结合免疫算法与强化学习,克服现有调度方法的不足,提升调度效率和灵活性,实现TSN‑5G列车车载网络内关键流量的确定性调度。
-
公开(公告)号:CN117473616A
公开(公告)日:2024-01-30
申请号:CN202311463023.1
申请日:2023-11-06
Applicant: 北京交通大学
Abstract: 本发明提供了一种基于多智能体强化学习的铁路BIM数据边缘缓存方法。该方法包括:构建BIMDipFM模型,利用BS下用户与BIM数据的历史交互信息对留存率进行预测,获取BIM数据的内容重要性程度,采用马尔可夫博弈模型建立多节点协同缓存模型,得到每个缓存节点的BIM数据缓存状态和需求状态,生成系统中智能体的当前时刻环境状态,构建动作掩码模块,过滤无效动作,输出动作空间,基于actor网络通过Gumble Softmax算法输出确定动作,Agent在环境中执行确定动作,输出奖励,获取新环境状态,将环境状态、确定动作、奖励和新环境状态储存经验回放池中,经验回放池储存满后进行经验回放,更新目标网络,以提高BIM数据的缓存效率,减轻云侧和核心网络的流量负载,提升用户访问速度。
-
公开(公告)号:CN117473616B
公开(公告)日:2025-03-25
申请号:CN202311463023.1
申请日:2023-11-06
Applicant: 北京交通大学
Abstract: 本发明提供了一种基于多智能体强化学习的铁路BIM数据边缘缓存方法。该方法包括:构建BIMDipFM模型,利用BS下用户与BIM数据的历史交互信息对留存率进行预测,获取BIM数据的内容重要性程度,采用马尔可夫博弈模型建立多节点协同缓存模型,得到每个缓存节点的BIM数据缓存状态和需求状态,生成系统中智能体的当前时刻环境状态,构建动作掩码模块,过滤无效动作,输出动作空间,基于actor网络通过Gumble Softmax算法输出确定动作,Agent在环境中执行确定动作,输出奖励,获取新环境状态,将环境状态、确定动作、奖励和新环境状态储存经验回放池中,经验回放池储存满后进行经验回放,更新目标网络,以提高BIM数据的缓存效率,减轻云侧和核心网络的流量负载,提升用户访问速度。
-
公开(公告)号:CN119485218A
公开(公告)日:2025-02-18
申请号:CN202411575785.5
申请日:2024-11-06
Applicant: 北京交通大学
Abstract: 本发明提供的一种基于多智能体强化学习的TSN‑5G列车通信网络异步调度方法。该方法包括:基于列车TSN‑5G异构场景的拓扑结构利用图神经网络构建马尔可夫模型,定义马尔可夫模型的状态空间、动作空间和奖励函数,将TSN‑5G异构网络中的待处理的数据流信息输入到列车TSN‑5G多智能体强化学习异步调度算法中,列车TSN‑5G多智能体强化学习异步调度算法将每个基站与交换机作为独立智能体,通过迭代运算对马尔可夫模型中的状态空间、动作空间进行更新,输出待处理的数据流的调度方案。本发明提出了一种综合方案,结合TSN‑5G中有线与无线信道的利用率与端到端抖动性能,达到优化数据传输的目的,以实现对整车网络的端到端时延和抖动进行最优控制。
-
-
-