-
公开(公告)号:CN116542134A
公开(公告)日:2023-08-04
申请号:CN202310392826.6
申请日:2023-04-13
Applicant: 南京大学
IPC: G06F30/27 , G06F16/2458 , G06F18/23213
Abstract: 本发明的目的是提供一种学件组织与查搜的方法和装置。所述方法包括:基于用户查搜模型的请求,向用户设备发送锚位规约、锚位模型以及学件库采用的核函数;接收用户设备发送的锚位模型损失和锚位规约的凸组合系数;根据所述锚位模型损失和锚位规约的凸组合系数,对学件库中的各个模型在用户任务上的损失进行估计;基于各个模型的估计损失,向用户返回估计损失最小的模型。本申请实施例具有以下优点:通过对学件库中的模型与缩略核均值嵌入规约进行组织得到锚位规约和锚位模型,并据此来查搜对用户有帮助的模型,能够有效识别模型在训练任务外的其它任务上可能具有的优异性能,提升了模型查搜的准确性和查搜效率。
-
公开(公告)号:CN116484970A
公开(公告)日:2023-07-25
申请号:CN202310396335.9
申请日:2023-04-13
Applicant: 南京大学
Abstract: 本发明公开一种基于锚位学件的学件查搜方法,在大规模学件库(学件市场)中进行高效模型查搜,分为两个阶段:上传阶段和部署阶段。在上传阶段,使用学件聚类来结构化地组织模型,确定锚位学件;在部署阶段,学件库将所有锚位学件传给用户,用户对得到的锚位学件评估并返回评估结果给学件库,学件库根据评估结果了解用户任务,从而进一步推荐学件给用户,用户选择有益学件。通过让用户首先评估锚位学件来缩小候选学件范围,避免了遍历学件库中的所有学件,达到了提高模型查搜效率的目的。
-
公开(公告)号:CN113721655B
公开(公告)日:2023-06-16
申请号:CN202110988096.7
申请日:2021-08-26
Applicant: 南京大学
IPC: G05D1/10
Abstract: 本发明公开一种控制周期自适应的强化学习无人机稳定飞行控制方法。本发明针对无人机飞行时灵敏性与稳定性的权衡问题,提出了基于强化学习的无人机自适应周期的控制方法。共包含以下关键环节:(1)构造动作增广的策略模型,在策略模型的动作输出中加入是否需要执行该动作的标志位。(2)在环境中运行策略模型时,若标志位为“是”,则执行策略模型输出的动作,并计一定的动作惩罚值;否则不执行该动作,且无惩罚值。(3)使用强化学习算法,通过策略模型与环境的交互,以最大化环境奖励并最小化动作惩罚值为目标,对策略模型进行优化。本发明使得无人机能够对其控制周期进行自适应的调整,同时保证了无人机的性能与飞行稳定性。
-
公开(公告)号:CN113276883B
公开(公告)日:2023-04-21
申请号:CN202110464610.7
申请日:2021-04-28
Applicant: 南京大学
Abstract: 本发明公开一种基于动态生成环境的无人车行驶策略规划方法及实现装置,(1)在模拟器中构建无人驾驶环境。(2)初始化强化学习参数及网络策略模型。(3)与环境交互,收集无人驾驶车辆当前状态,由策略网络进行动作采样,在模拟器中执行动作并进入新的状态。(4)收集车辆在一段生成环境中的累积奖励以及是否成功完成任务,并建立一段新的生成环境。(5)对于车辆的行驶策略,在重复(3)中的操作采集一定强化学习样本后,进行强策略迭代。(6)对于车辆所面临的环境,将由(4)中所述的模式不断生成,并基于对是否成功以及累积奖励的收集,抽取那些失败道路以及低累积奖励道路的环境参数,在这些路段进行反复多次训练。(7)持续上述步骤训练直到策略收敛。
-
公开(公告)号:CN111444721B
公开(公告)日:2022-09-23
申请号:CN202010460134.7
申请日:2020-05-27
Applicant: 南京大学
IPC: G06F40/295 , G06F40/30 , G06F40/211 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于预训练语言模型的中文文本关键信息抽取方法,具体步骤如下:(1)将待抽取的关键信息进行分类,易于归纳组成规则的信息类别,使用正则匹配的方法抽取。(2)对命名实体使用序列标注模型抽取。(3)序列标注模型采用对预训练语言模型微调的方法进行构建,首先使用大规模无标记文本语料学习得到预训练语言模型,并在预训练阶段引入词边界特征。(4)将使用规则匹配的数据内容替换为其对应的规则模板标签,以完成规则匹配与深度网络的融合。(5)根据有标记的训练数据,在预训练语言模型上进行微调,将其迁移到命名实体的序列标注任务上。本发明可以有效提取文本上下文语义特征,并且在复杂信息类别的场景下有效地识别各个信息种类。
-
公开(公告)号:CN109711907B
公开(公告)日:2022-09-23
申请号:CN201910052451.2
申请日:2019-01-21
Applicant: 南京大学
IPC: G06Q30/02
Abstract: 本发明公开一种基于顶端排序的在线广告排序方法,利用消费者只关注顶部推荐位置广告的用户特性,采用顶端排序模型(TopPush算法)来进行待推荐广告的有效排序,得到当时段广告各个特征的权重,量化出广告不同维度的重要性。同时使用大窗口(过去多时间段样本)与小窗口(拼接过去多时段特征及转化率)框架,通过窗口的滑动来动态的更新排序结果,将预测高转化率的广告排序在前,从而更有针对性的为消费者提供商品推荐,以提升推荐效果。
-
公开(公告)号:CN115035330A
公开(公告)日:2022-09-09
申请号:CN202210461879.4
申请日:2022-04-28
Applicant: 南京大学
IPC: G06V10/764 , G06V10/82 , G06N3/04 , G06K9/62
Abstract: 本发明公开了一种面向环境变化的无监督迁移学习图像分类方法,获取待分类图片,若不存在面向应用环境的模型,则从学习环境迁移学习新模型;收集训练数据,初始化模型;在伪标签生成器上,计算有标签样本的分类损失以及学习环境和应用环境数据的分布偏移损失,并生成部分伪标签;设计多个联合分类器输出二维联合概率同时预测图片主任务和自监督任务标签,计算联合分类器的分类损失;在联合分类器输出中,对自监督任务标签的边际概率积分,得到不同的概念标签;计算应用环境样本的不同概念标签间的一致性损失;累加所有损失,用梯度反向传播更新参数;迭代训练至最大迭代次数;用所有联合分类器对待分类图片的概念标签均值来预测。
-
公开(公告)号:CN114580506A
公开(公告)日:2022-06-03
申请号:CN202210149568.4
申请日:2022-02-18
Applicant: 南京大学
Abstract: 本发明公开一种基于数据精简的高效异常流量检测方法和系统,获取基站数据库中的真实数据;随机初始化模拟数据;随机初始化一个异常流量检测模型;分别使用真实数据和模拟数据训练模型,记录模型在两组数据上的损失函数和对应的参数梯度;计算两组梯度之间的欧式距离;最小化上述欧式距离以更新模拟数据;重复上述过程,直到模拟数据收敛,记录模拟数据,并清空基站数据库中的真实数据。用户选定一种异常流量检测模型,初始化该模型;获取之前保存的模拟数据;使用模拟数据训练该模型。本发明基于梯度匹配来获取少量的模拟数据,大大减缓了基站数据库的存储压力,并保证模型的性能不变差。
-
公开(公告)号:CN113160562B
公开(公告)日:2022-04-22
申请号:CN202110337809.3
申请日:2021-03-30
Applicant: 南京大学
IPC: G08G1/01 , G08G1/0967 , G06N3/00 , G06N20/00
Abstract: 本发明公开了一种基于粒子注意力深度Q学习的部分观测路口自主并道方法,着眼于路口场景、车辆并道任务、观测视野被楼宇和其他车辆遮挡住的部分观测条件,使用强化学习中的深度Q学习算法对给定路线的并道车辆的驾驶行为进行优化。使用低维物理信息量作为车辆的观测表征;使用基于粒子的表示处理因遮挡造成的部分观测问题;通过引入注意力机制优化状态表示,使模型可以仅接受未被遮挡到的车辆信息同时具有输入排列不变性;使用深度Q学习算法根据获取到的社会车辆信息输出当前最优驾驶动作;通过在经验回放池中加入多种车流密度下的采样数据,结合优先经验回放技术,使自主并道行为可以适应真实环境下多变的车流密度。
-
公开(公告)号:CN114003393A
公开(公告)日:2022-02-01
申请号:CN202111639857.4
申请日:2021-12-30
Applicant: 南京大学
Abstract: 本发明公开了一种基于双层树的提高集成型自动机器学习运行性能的方法和系统,对于模型选择和超参数调优两个过程采用了双层树式的逻辑关系。通过极限区域上置信界算法对双层树式的上下两层进行迭代计算。根据机器学习模型库中各模型的初始化分数,自适应地将各模型分配到合适的线程上,有前景的模型将得到更多的初始线程分配。以不同模型和不同超参数配置下的评估指标的分数和运行时间为依据,选择其中若干个模型,基于选中的模型生成集成模型。本发明使自动机器学习方法可以在相同的计算资源下得到更好的最终效果。
-
-
-
-
-
-
-
-
-