-
公开(公告)号:CN113721655B
公开(公告)日:2023-06-16
申请号:CN202110988096.7
申请日:2021-08-26
Applicant: 南京大学
IPC: G05D1/10
Abstract: 本发明公开一种控制周期自适应的强化学习无人机稳定飞行控制方法。本发明针对无人机飞行时灵敏性与稳定性的权衡问题,提出了基于强化学习的无人机自适应周期的控制方法。共包含以下关键环节:(1)构造动作增广的策略模型,在策略模型的动作输出中加入是否需要执行该动作的标志位。(2)在环境中运行策略模型时,若标志位为“是”,则执行策略模型输出的动作,并计一定的动作惩罚值;否则不执行该动作,且无惩罚值。(3)使用强化学习算法,通过策略模型与环境的交互,以最大化环境奖励并最小化动作惩罚值为目标,对策略模型进行优化。本发明使得无人机能够对其控制周期进行自适应的调整,同时保证了无人机的性能与飞行稳定性。
-
公开(公告)号:CN115035330A
公开(公告)日:2022-09-09
申请号:CN202210461879.4
申请日:2022-04-28
Applicant: 南京大学
IPC: G06V10/764 , G06V10/82 , G06N3/04 , G06K9/62
Abstract: 本发明公开了一种面向环境变化的无监督迁移学习图像分类方法,获取待分类图片,若不存在面向应用环境的模型,则从学习环境迁移学习新模型;收集训练数据,初始化模型;在伪标签生成器上,计算有标签样本的分类损失以及学习环境和应用环境数据的分布偏移损失,并生成部分伪标签;设计多个联合分类器输出二维联合概率同时预测图片主任务和自监督任务标签,计算联合分类器的分类损失;在联合分类器输出中,对自监督任务标签的边际概率积分,得到不同的概念标签;计算应用环境样本的不同概念标签间的一致性损失;累加所有损失,用梯度反向传播更新参数;迭代训练至最大迭代次数;用所有联合分类器对待分类图片的概念标签均值来预测。
-
公开(公告)号:CN108763063B
公开(公告)日:2022-07-12
申请号:CN201810436555.9
申请日:2018-05-09
Applicant: 南京大学
IPC: G06F11/36
Abstract: 本发明公开了一种无需缺陷标注数据的软件缺陷检测方法,首先获取所有已完成编码的等待测试的软件模块,构造无缺陷标注的数据集合;利用无缺陷标注的数据集合通过异常检测算法建立软件缺陷检测模型;通过建立好的模型输出每个未检测的软件模块的检测分数,表示模块中有缺陷的可能性大小,分数越高说明模块存在缺陷的可能性越大;将所有等待测试的模块按照检测分数由高到低排序,并将等待测试的模块按此顺序依次送交测试人员进行测试,直到所有模块都进行过测试或没有可用的测试资源时结束。本发明能够在没有缺陷标注数据的情况下检测软件缺陷,解决了当前的软件缺陷检测方法需要大量测试资源以获取缺陷标注数据的问题。
-
公开(公告)号:CN113160562B
公开(公告)日:2022-04-22
申请号:CN202110337809.3
申请日:2021-03-30
Applicant: 南京大学
IPC: G08G1/01 , G08G1/0967 , G06N3/00 , G06N20/00
Abstract: 本发明公开了一种基于粒子注意力深度Q学习的部分观测路口自主并道方法,着眼于路口场景、车辆并道任务、观测视野被楼宇和其他车辆遮挡住的部分观测条件,使用强化学习中的深度Q学习算法对给定路线的并道车辆的驾驶行为进行优化。使用低维物理信息量作为车辆的观测表征;使用基于粒子的表示处理因遮挡造成的部分观测问题;通过引入注意力机制优化状态表示,使模型可以仅接受未被遮挡到的车辆信息同时具有输入排列不变性;使用深度Q学习算法根据获取到的社会车辆信息输出当前最优驾驶动作;通过在经验回放池中加入多种车流密度下的采样数据,结合优先经验回放技术,使自主并道行为可以适应真实环境下多变的车流密度。
-
公开(公告)号:CN113064586B
公开(公告)日:2022-04-22
申请号:CN202110515134.7
申请日:2021-05-12
Applicant: 南京大学
Abstract: 本发明公开一种基于抽象语法树增广图模型的代码补全方法,包括以下步骤:等待新的代码补全需求,获取待补全位置附近的源代码片段;解析待补全的源代码,将其表示为抽象语法树;遍历抽象语法树上各节点之间的顺序、语法和语义关系,通过带不同标记的有向边连接这些节点,将其表示为图的形式;将以图形式表示的代码进一步编码为矩阵形式;检查是否存在利用图信息的代码补全模型,若不存在,则训练代码补全模型;将编码后的图信息输入代码补全模型,给出预测结果。本发明将程序语言代码表示为图的形式,更好地体现代码各个语法单元之间的顺序、语法和语义关系,从而利用这些信息获得更高的预测准确率。
-
公开(公告)号:CN113467515A
公开(公告)日:2021-10-01
申请号:CN202110828301.3
申请日:2021-07-22
Applicant: 南京大学
IPC: G05D1/10
Abstract: 本发明公开一种基于虚拟环境模仿重构和强化学习的无人机飞行控制方法,利用在真实飞行环境中采集到的状态转移历史轨迹数据,利用GAIL+BC算法构建基于模仿学习的虚拟环境;在虚拟环境中利用强化学习算法训练无人机飞行策略;将策略迁移到真实环境中。本发明使无人机能够在复杂多变的环境中,实现有效,稳定的自主飞行控制;通过利用历史交互数据构建虚拟环境,并让强化学习Agent在虚拟环境中训练的方式,避免了强化学习的高试错成本弊端,同时不再依赖专家知识和人力,并提高了模型对特殊环境状态的适应能力。通过GAIL算法和BC算法两种算法的结合,避免了基于纯模仿学习算法的收敛性问题,也避免了纯BC算法的模型偏移问题,解决了传统的虚拟环境重构算法的应用难题。
-
公开(公告)号:CN113205220A
公开(公告)日:2021-08-03
申请号:CN202110517463.5
申请日:2021-05-12
Applicant: 南京大学
Abstract: 本发明公开一种面向实时订单数据的无人机物流配送全局规划方法,首先接收新触发的实时订单数据,并提取当前无人机执行状态,对每架无人机预分配订单;之后根据深度学习模型指针网络,融合外部信息生成部分动作序列,并用启发式算法两元素优化进行优化;再使用贪心插入的方法,构造出中间动作序列,并用模拟退火框架进行可行性验证;之后根据预规划的执行动作序列提取出环境状态,传递给通过深度强化学习框架PPO训练出的订单分配智能体进行订单分配;订单分配之后,根据订单分配结果、预规划计算的动作序列,提取出各无人机执行订单的方案,并将无人机的配送方案发布出来。本发明适用于订单不断生成的动态情境。
-
公开(公告)号:CN113064586A
公开(公告)日:2021-07-02
申请号:CN202110515134.7
申请日:2021-05-12
Applicant: 南京大学
Abstract: 本发明公开一种基于抽象语法树增广图模型的代码补全方法,包括以下步骤:等待新的代码补全需求,获取待补全位置附近的源代码片段;解析待补全的源代码,将其表示为抽象语法树;遍历抽象语法树上各节点之间的顺序、语法和语义关系,通过带不同标记的有向边连接这些节点,将其表示为图的形式;将以图形式表示的代码进一步编码为矩阵形式;检查是否存在利用图信息的代码补全模型,若不存在,则训练代码补全模型;将编码后的图信息输入代码补全模型,给出预测结果。本发明将程序语言代码表示为图的形式,更好地体现代码各个语法单元之间的顺序、语法和语义关系,从而利用这些信息获得更高的预测准确率。
-
公开(公告)号:CN105930277A
公开(公告)日:2016-09-07
申请号:CN201610543653.3
申请日:2016-07-11
Applicant: 南京大学
IPC: G06F11/36
CPC classification number: G06F11/3608
Abstract: 本发明公开一种基于缺陷报告分析的缺陷源代码定位方法,首先获得新的待检查缺陷报告;如果不存在缺陷定位模型,建立缺陷定位模型。建立缺陷定位模型:获取大量历史缺陷报告、源代码和缺陷定位标记,构造训练集合;初始化缺陷定位模型;利用当前模型,提取训练集合缺陷报告和源代码的统一特征;计算当前模型的缺陷定位训练误差;若缺陷定位模型的训练误差低于预设阈值,模型训练完成,否则更新缺陷定位模型权重参数,继续训练。利用模型提取待检查的缺陷报告和源代码的统一特征并利用统一特征定位包含缺陷的源代码模块;输出定位到的缺陷源代码模块;若还有缺陷报告尚未检查,继续获取并分析新的待检查缺陷报告,否则缺陷定位过程结束。
-
公开(公告)号:CN103092762A
公开(公告)日:2013-05-08
申请号:CN201310053478.6
申请日:2013-02-19
Applicant: 南京大学
IPC: G06F11/36
Abstract: 本发明公开一种适用于快速软件开发模式的实时软件缺陷检测方法,首先初始化模型使其对任意模块的检测结果置信度为0;等待并接收一个刚完成编码的软件模块;利用当前缺陷检测模型对所接收的软件模块进行实时检测;若缺陷检测模型的缺陷检测置信度低于预设阈值,将所接收的软件模块送交测试人员进行详细测试,输出其缺陷情况,否则直接输出检测结果;利用接收到的软件模块对当前模型进行实时增量式建模;返回等待步骤接收新的软件模块直至所有软件模块开发完毕。该方法能够在编码过程中同步利用不断积累的软件模块进行实时建模,并在每个模块开发完成后及时为开发人员提供该模块的缺陷预警。
-
-
-
-
-
-
-
-
-