-
公开(公告)号:CN112329009B
公开(公告)日:2022-12-06
申请号:CN202011081206.3
申请日:2020-10-12
Applicant: 南京理工大学
Abstract: 本发明公开了一种针对联合学习中噪声攻击的防御方法。该方法为:在聚合端聚合用户上传的参数之前,由服务器预先检验用户的可信度,并据此设置聚合时各个用户的权重,步骤如下:服务器利用已有公共数据产生初始模型,并分发给参与训练的用户端;每个用户端在本地更新模型,然后将结果上传至服务器;从第二轮上传开始,服务器计算每个用户端上传的模型参数与前一次上传参数之间的相关性,并将得到的所有相关性结果进行归一化处理,以此作为聚合时每个用户端的权重,生成新的全局模型;新的全局模型将再次被发送给所有用户端开始新一轮的训练,直到达到系统结束要求。本发明有效地防御了噪声攻击,提高了训练模型的精度,成本低廉且易于实现。
-
公开(公告)号:CN111862165B
公开(公告)日:2022-10-21
申请号:CN202010554226.1
申请日:2020-06-17
Applicant: 南京理工大学
IPC: G06T7/277 , G06V10/764 , G06V10/82 , G06V10/774 , G06N3/04 , G06N3/08 , H04W84/18
Abstract: 本发明涉及一种基于深度强化学习更新卡尔曼滤波器的目标追踪方法。该方法包括以下步骤:利用传感器进行数据采集,获得原始追踪场景数据;对原始追踪场景数据进行分类,获得不同目标追踪场景下的数据;针对不同目标追踪场景下的数据,分别利用深度强化学习的方法进行多次训练直到收敛,获得最优策略,最优策略是一个神经网络,输入为卡尔曼滤波器的预测值与传感器的测量值,输出的动作为卡尔曼滤波器的更新方法;将最优策略进行线下部署,应用到实际的追踪场景进行目标追踪。本发明适用于实际传感器网络中的目标追踪,有效提高了追踪的精度。
-
公开(公告)号:CN111785045A
公开(公告)日:2020-10-16
申请号:CN202010555263.4
申请日:2020-06-17
Applicant: 南京理工大学
Abstract: 本发明公开了一种基于演员-评论家算法的分布式交通信号灯联合控制方法。该方法包括以下步骤:将多智能体组成的网络进行数学建模;对分布式交通信号灯控制系统中单个交通路口的马尔可夫决策过程进行建模,定义状态集、动作集、单步奖励值;构建多智能体联合控制模式,智能体之间建立通信连接交换各自的信息;建立柔性优势演员-评论家算法,在单步奖励值中加入下一状态的策略熵,构建价值函数并加入优势函数;基于柔性优势演员-评论家算法,以最小化车辆的平均等待时间为目标,每个交通路口的智能体采用联合柔性优势演员-评论家算法进行学习和控制信号灯。本发明通过不同交通路口信号灯之间的协作控制,提升了交通网络整体的道路通畅度。
-
公开(公告)号:CN110430585B
公开(公告)日:2023-05-02
申请号:CN201910723536.9
申请日:2019-08-07
Applicant: 南京理工大学
Abstract: 本发明公开了一种分布式传感器网络中用于追踪的广播节点选择方法。我们根据接收到的上一时刻的部分传感器信息,更新当前时刻的目标状态的估计值与真实值之间的协方差矩阵,同时结合传感器节点在当前时刻之前所有的协方差矩阵来挑选估计质量最好的传感器用来作为广播节点。实验结果表明,该方法较传统的方法,能够显著的提高在追踪过程中传感器网络的能量利用效率和带宽资源利用效率。
-
公开(公告)号:CN111785045B
公开(公告)日:2022-07-05
申请号:CN202010555263.4
申请日:2020-06-17
Applicant: 南京理工大学
Abstract: 本发明公开了一种基于演员‑评论家算法的分布式交通信号灯联合控制方法。该方法包括以下步骤:将多智能体组成的网络进行数学建模;对分布式交通信号灯控制系统中单个交通路口的马尔可夫决策过程进行建模,定义状态集、动作集、单步奖励值;构建多智能体联合控制模式,智能体之间建立通信连接交换各自的信息;建立柔性优势演员‑评论家算法,在单步奖励值中加入下一状态的策略熵,构建价值函数并加入优势函数;基于柔性优势演员‑评论家算法,以最小化车辆的平均等待时间为目标,每个交通路口的智能体采用联合柔性优势演员‑评论家算法进行学习和控制信号灯。本发明通过不同交通路口信号灯之间的协作控制,提升了交通网络整体的道路通畅度。
-
公开(公告)号:CN110267193A
公开(公告)日:2019-09-20
申请号:CN201910458141.0
申请日:2019-05-29
Applicant: 南京理工大学
Abstract: 本发明公开了一种基于马尔科夫决策过程模型的车辆位置跟踪方法,包括以下步骤:建立二维道路网络模型;定义传感器簇的状态、动作以及奖励,建立马尔可夫决策过程模型,利用强化学习得到传感器簇的最优动作序列以实现初步跟踪;利用基于RSSI的高斯权重定位算法进行目标车辆的精确跟踪。本发明实现了车辆的精确定位,为车辆位置跟踪的有效实施提供帮助。
-
公开(公告)号:CN110213827B
公开(公告)日:2023-05-02
申请号:CN201910439512.0
申请日:2019-05-24
Applicant: 南京理工大学
Abstract: 本发明设计了一套应用于道路安全的算法,实现了在监控路上车辆时数据采集频率的动态调整。由于数据中心监控道路的车辆情况时都是固定的数据采集频率,可能会导致对危险情况的关注度不够,造成不必要的资源浪费,同时大量上传的数据也会对数据中心处理数据产生一定的压力,因此考虑在数据的采集过程中对数据进行预处理。本发明通过对道路环境与车辆移动的建模,获得采集频率与道路状况的匹配度。通过结合深度强化学习算法,找出在每个时刻针对于每种状况的最优决策,从而获得最优的匹配度与最少的能源消耗,从而极大提升数据中心对行驶车辆数据采集的效率。
-
公开(公告)号:CN110267193B
公开(公告)日:2021-02-12
申请号:CN201910458141.0
申请日:2019-05-29
Applicant: 南京理工大学
Abstract: 本发明公开了一种基于马尔科夫决策过程模型的车辆位置跟踪方法,包括以下步骤:建立二维道路网络模型;定义传感器簇的状态、动作以及奖励,建立马尔可夫决策过程模型,利用强化学习得到传感器簇的最优动作序列以实现初步跟踪;利用基于RSSI的高斯权重定位算法进行目标车辆的精确跟踪。本发明实现了车辆的精确定位,为车辆位置跟踪的有效实施提供帮助。
-
公开(公告)号:CN110719126A
公开(公告)日:2020-01-21
申请号:CN201910832575.2
申请日:2019-09-04
Applicant: 南京理工大学
IPC: H04B7/0413 , H04B7/0456 , H04W12/00
Abstract: 本发明公开了一种适用于MIMO通信系统的隐蔽通信方法,包括以下内容:获取MIMO通信系统进行不同隐蔽信息量通信的发射天线数向量记为隐蔽天线数向量;针对隐蔽天线数向量的每一个隐蔽天线数,生成其对应的码本;随机生成需要传递的隐蔽信息,并根据生成的码本将该隐蔽信息嵌入发射序列进行传输;在MIMO通信系统的接收端对收到的信息序列进行分离,获取隐蔽信息;根据发送端传递的隐蔽信息与接收端获取的隐蔽信息求取误码率。本发明方法简单,实现简易,且在物理层实现,隐蔽性高;此外发射隐蔽信息的天线数可以动态调节,即信道容量可以动态分配,能满足发射不同隐蔽信息量的需求,适应性广。
-
公开(公告)号:CN110430585A
公开(公告)日:2019-11-08
申请号:CN201910723536.9
申请日:2019-08-07
Applicant: 南京理工大学
Abstract: 本发明公开了一种分布式传感器网络中用于追踪的广播节点选择方法。我们根据接收到的上一时刻的部分传感器信息,更新当前时刻的目标状态的估计值与真实值之间的协方差矩阵,同时结合传感器节点在当前时刻之前所有的协方差矩阵来挑选估计质量最好的传感器用来作为广播节点。实验结果表明,该方法较传统的方法,能够显著的提高在追踪过程中传感器网络的能量利用效率和带宽资源利用效率。
-
-
-
-
-
-
-
-
-