-
公开(公告)号:CN118298280A
公开(公告)日:2024-07-05
申请号:CN202410482569.X
申请日:2024-04-22
IPC: G06V10/82 , G06V10/764 , G06V10/77 , G06N3/0455 , G06N3/0464 , G06N3/047 , G06N3/0475 , G06N3/092 , G06N3/094 , G06N3/006
Abstract: 本发明公开了一种基于强化学习的民航领域自适应数据表示对齐方法,该方法将领域适应与强化学习分开。本发明引入了特征级和像素级的多粒度约束来指导训练过程。在特征层面引入领域对抗训练和互信息最大化约束,实现了特征的跨领域对齐,从而显著提高了源智能体在目标领域的性能。同时,在像素级引入循环一致变分自编码器(Cycle‑Consistent Variational Autoencoders,VAE),促进域通用特征和域特定特征的解耦,并保持状态图像中的判别信息。在第二阶段,本发明基于提取的域不变特征,在源域中使用深度强化学习技术训练智能体。由于智能体是用跨域不变特征训练的,因此它的行为策略可以在不同的域之间转移,因此有望在不与环境交互的情况下在目标域中获得良好的性能。
-
公开(公告)号:CN118297140A
公开(公告)日:2024-07-05
申请号:CN202410482564.7
申请日:2024-04-22
IPC: G06N3/098 , G06N3/096 , G06N3/045 , G06N3/0495 , G06F18/241 , G06V10/764 , G06V10/82 , G06V10/94
Abstract: 本发明公开了一种基于可重用分类器的联邦蒸馏学习方法,主要用于增强神经网络的泛化能力,从而提高网络性能。该方法包括以下步骤:S1,在联邦知识蒸馏中重用来自异构模型的分类器,降低蒸馏策略的计算复杂度并提高全局模型的泛化能力;S2,引入自适应且可学习的轻量级映射器,确保特征映射和分类器之间的尺寸兼容性;S3,结合分类器之间注意力权重向量的计算,有效解决局部知识偏差对全局知识的影响。本发明方法通过重用客户端的分类器和分配注意力权重来提高网络性能,从而增强全局神经网络的泛化性。此外,FedMAC为每个客户端分配一个可训练的映射器,以对齐特征图、捕获关键知识并过滤掉负面知识。
-
公开(公告)号:CN118036779A
公开(公告)日:2024-05-14
申请号:CN202410168739.7
申请日:2024-02-06
Applicant: 电子科技大学
Abstract: 本发明公开了一种异构数据下具有拜占庭鲁棒性的轻量级安全联邦学习方法,包括以下步骤:S1,构建全局模型的目标函数;S2,建立全局模型的安全协同计算的系统模型;S3,拟定多个用于系统模型的安全计算协议;S4,在安全计算协议下,利用系统实现用户安全计算本地梯度和双服务器协同计算梯度聚合,从而完成全局模型的协同训练。通过上述设计,本发明利用用户本地模型与全局模型的二范数作为本地目标函数的惩罚项,以约束本地梯度过于发散,提高在Non‑IID场景下恶意梯度和真实梯度的区分度。
-
公开(公告)号:CN117196169A
公开(公告)日:2023-12-08
申请号:CN202310761727.0
申请日:2023-06-26
Applicant: 电子科技大学
IPC: G06Q10/0631 , G06N3/0464 , G06N3/08 , G06Q50/30
Abstract: 本发明公开了一种基于深度强化学习的机位调度方法,该方法通过对民航机位调度问题以最大化民航机位调度结果的靠桥率作为优化目标进行马尔可夫建模,设定状态空间、动作空间、状态转移以及奖励函数。采用基于卷积神经网络的Actor‑Critic算法,通过卷积神经网络提取状态特征,并通过多层全连接神经网络建立策略网络和价值网络的模型结构对马尔可夫模型进行模型训练求解,从而使得在为飞机提供保障时,保障项目全、保障能力强、物资调配快,同时还能够为飞机提供电力和空调,提高靠桥率,能够大量减少燃油消耗并有利于控制机场的污染物排放。对于乘客来说,由于近机位与航站楼直接相接,提升靠桥率,能够大大减少乘客行走距离,显著提高乘客满意度。
-
公开(公告)号:CN113723220B
公开(公告)日:2023-08-25
申请号:CN202110919472.7
申请日:2021-08-11
Applicant: 电子科技大学
Inventor: 倪志彬 , 唐龙翔 , 王昊龙 , 梁淇奥 , 何震宇 , 蒋新科 , 向芝莹 , 周啸宇 , 石爻 , 李顺 , 左健甫 , 杨若辰 , 吴世涵 , 张恩华 , 吉雪莲 , 常世晴 , 罗佳源 , 陈攀宇 , 王瑞锦
IPC: G06V40/16 , G06V10/82 , G06N3/0464 , G06N3/08 , G06N20/00
Abstract: 本发明公开了基于大数据联邦学习架构下的深度伪造溯源系统,包括依次顺序连接的应用层、接口层、逻辑层、网络层和存储层;应用层用于为用户提供深度伪造溯源服务,并获取用户登录和上传数据;接口层用于提供接口服务,实现服务器端和web端之间通信;逻辑层用于划分系统功能,并设计算法构建模型实现系统功能逻辑;网络层用于进行参数交换,并对建模过程中的梯度信息进行加密;存储层用于接收传输的参数信息和加密信息,并存储在本地数据库和区块链网络中。本发明提出联邦防伪溯源链的整体架构,建立联邦防伪、异常溯源、风险预测三重机制,在能够防范Web安全威胁的同时还能够有效解决针对联邦学习的数据投毒与单点故障问题。
-
公开(公告)号:CN116258352B
公开(公告)日:2023-08-18
申请号:CN202310538885.X
申请日:2023-05-15
Applicant: 中国民用航空总局第二研究所 , 民航成都信息技术有限公司 , 电子科技大学
IPC: G06Q10/0631 , G06Q50/30
Abstract: 本申请提供了一种航班保障任务的调度方法、装置及电子设备,航班保障任务的调度方法包括:获取目标航班保障任务组对应的各个航班保障代理机构的状态信息;将状态信息输入到训练好的调度策略选择模型中,确定目标航班保障任务组对应的目标航班保障节点顺序以及每个目标航班保障节点对应的目标调度策略,目标调度策略包括最早航班保障代理机构优先调度策略、最紧迫航班优先调度策略以及最短工时航班保障节点优先调度策略;基于每个目标航班保障节点的目标调度策略,确定目标航班保障任务组对应的组合目标调度策略,以便完成对目标航班保障任务组的调度。本申请实现了对各大航班的目标航班保障任务组的动态灵活调度,进而提升了机场的运行效率。
-
公开(公告)号:CN116094993A
公开(公告)日:2023-05-09
申请号:CN202211657554.X
申请日:2022-12-22
Applicant: 电子科技大学
Abstract: 本发明公开了一种适用于边缘计算场景下的联邦学习安全聚合方法,包括:(1)边缘节点将各个终端之间的通信拓扑图结构由全连通图修改为基于最小生成树的终端连通拓扑图;(2)各个终端利用本地数据训练联邦学习的模型,并根据修改的终端连通拓扑图与邻居终端以广播密钥的方式进行通信;(3)各个终端计算掩码并用于加密模型梯度;(4)边缘节点接收终端传输的加密的模型梯度并进行局部聚合;(5)云计算处理中心接收来局部聚合模型梯度,再进行一次聚合形成全局聚合模型,并将全局聚合模型下发到边缘节点,为终端提供服务。本发明在解决联邦学习中隐私泄露问题的同时,避免了需要大量额外的计算和通信开销,并提高了模型的收敛速度。
-
公开(公告)号:CN113010282B
公开(公告)日:2023-04-18
申请号:CN202110235757.9
申请日:2021-03-03
Applicant: 电子科技大学 , 四川虹信软件股份有限公司
IPC: G06F9/48
Abstract: 本发明公开了一种基于深度强化学习的边云协同串行任务卸载方法,包括S1:用户设备产生串行任务,并发送任务卸载请求至MEC服务器;S2:MEC服务器接收到用户设备发送的任务卸载请求后,获取当前系统状态;通过计算获得权重向量,并根据当前状态,得到最优卸载策略;S3:根据得到的最优卸载策略,执行卸载任务。本发明通过对串行任务的权重分配,实现了网络边缘和云端协同的串行任务动态分配处理,为不同的用户设备应用提供低时延高能效的任务卸载服务。
-
公开(公告)号:CN114244456B
公开(公告)日:2023-01-24
申请号:CN202111589637.5
申请日:2021-12-23
Applicant: 电子科技大学
IPC: H04B17/336 , G06N3/04 , G06V10/764 , G06V10/82
Abstract: 本发明公开了一种基于生成对抗网络的无线电数据增扩与分类方法,利用GAN捕获样本数据分布,生成具有原始数据分布特征的高质量“伪造”数据,从而解决获取无线调制数据困难与成本较高的问题;优化了调制数据分类模型,提出了调制分类模型AMCST,提高了调制数据的分类准确率。通过在公共数据集上的实验,证明了所提出的数据增扩方法可以极大地提高调制分类模型AMCST分类准确率。在未来的工作中,本发明将研究其他深度学习模型,如变分自编码器及其变种,在调制数据增扩领域的应用。
-
公开(公告)号:CN115526333A
公开(公告)日:2022-12-27
申请号:CN202211052967.5
申请日:2022-08-31
Applicant: 电子科技大学
Abstract: 本发明公开了一种边缘场景下动态权重的联邦学习方法,涉及机器学习技术领域,包括筛选客户端;下发全局模型给各客户端;客户端更新自身的计算能力值;客户端对全局模型进行训练;客户端根据计算能力值λ*和模型训练总时长,计算设备权重;对于每一客户端,若其模型训练总时长大于或等于截止时长,则直接返回参数至边缘服务器,否则通过增加余项对全局模型参数进行优化后,再返回参数至边缘服务器;边缘服务器根据设备权重所有返回的全局模型参数进行聚合,得到最终全局模型参数。本发明减少了因训练速度不一致导致部分设备带来的异构性影响,根据服务质量确定在最终模型聚合时的占比,从而确保聚合的结果在复杂的真实情况下更具有鲁棒性。
-
-
-
-
-
-
-
-
-