一种基于SAC的多无人机辅助移动边缘计算方法、装置及存储介质

    公开(公告)号:CN117236561A

    公开(公告)日:2023-12-15

    申请号:CN202311293225.6

    申请日:2023-10-08

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于SAC的多无人机辅助移动边缘计算方法、装置及存储介质,属于移动边缘计算技术领域。所述方法包括:获取边缘计算系统中的基本要素信息;根据所述信息,建立无人机路径规划及资源分配的优化模型;将各无人机作为决策者,将无人机的观测作为状态,将无人机选择的路径规划及资源分配策略作为动作,基于预设的奖励函数和折扣因子,将所述优化模型转化为马尔科夫决策过程;各无人机利用预先训练的深度强化神经网络,基于实时观测信息对所述马尔科夫决策过程进行求解,得到优化后的无人机飞行轨迹及资源分配策略。本发明通过多无人机联合基站辅助地面用户边缘计算,策略优化以实现任务处理效率的提升、能耗分散及计算资源的节约。

    基于强化学习的规避静态恶意软件检测器的对抗攻击方法

    公开(公告)号:CN119249418A

    公开(公告)日:2025-01-03

    申请号:CN202411219418.1

    申请日:2024-09-02

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于强化学习的规避静态恶意软件检测器的对抗攻击方法,通过重新设计强化学习算法中智能体所使用的状态空间和行动空间,改善以往工作中对抗样本生成效率低的问题。首次将对抗样本功能是否保留的验证操作作为样本生成过程的一个组成部分纳入该框架,从而大大提高了验证效率。我们选择了多种当前流行的静态恶意软件检测器作为受害者模型,以评估攻击框架的有效性和鲁棒性。通过对检测器的可解释性和攻击结果的分析,阐明了这些检测器潜在的漏洞。最后,采用了一种基于迁移学习的策略提炼方法,以增强该框架攻击的泛化性。通过学习针对不同检测器训练后的专家智能体的知识,该框架针对不同类型的检测器均可以发起有效的攻击。

Patent Agency Ranking