-
公开(公告)号:CN105894350A
公开(公告)日:2016-08-24
申请号:CN201610188765.1
申请日:2016-03-29
Applicant: 南京大学
CPC classification number: G06Q30/0631 , G06K9/6256
Abstract: 本发明公开了一种基于多示例多标记学习的手机游戏道具推荐方法,包括如下步骤:首先将游戏原始运营数据转化为MIML的形式,生成MIML训练数据集合;然后根据训练数据集合训练推荐模型;将测试用户数据转化为MIML的形式,用得到的推荐模型进行预测,输出相关的标记排序作为推荐结果。本发明提出的方法有效利用了玩家行为数据中的大量事件上下文、玩家行为数据中与道具购买并不直接相关的事件,推荐的结果更加准确。
-
公开(公告)号:CN104102705A
公开(公告)日:2014-10-15
申请号:CN201410326282.4
申请日:2014-07-09
Applicant: 南京大学
IPC: G06F17/30
CPC classification number: G06F17/30017 , G06K9/6267
Abstract: 本发明公开一种基于大间隔分布学习的数字媒体对象分类方法,为了克服数字媒体对象类别标记的噪声问题,通过最大化间隔均值同时最小化间隔方差,最终将数字媒体对象的分类问题形式化成一个凸二次优化问题,并根据是否使用非线性核函数以及训练数字媒体对象库本身的特征,给出了分别基于对偶坐标下降和基于平均随机梯度下降两种寻优算法的实现,用户可根据实际情况自行选择。若用户选择非线性核函数,则训练时选择DCD作为寻优算法;若用户选择线性核函数,且训练数字媒体对象库样本很多或特征很稀疏,则训练时选择ASGD作为寻优算法,否则依然选择DCD作为寻优算法。
-
公开(公告)号:CN102521623A
公开(公告)日:2012-06-27
申请号:CN201110407426.5
申请日:2011-12-09
Applicant: 南京大学
IPC: G06K9/66
Abstract: 本发明公开了一种基于子空间的增量学习人脸识别方法,包括以下步骤:步骤一:人脸图片的预处理;步骤二:生成一组以上训练样本子空间和一组测试图片子空间:步骤三:比较测试图片子空间与一组以上训练样本子空间之间的相似度;步骤四:增量学习:如果在步骤三中标识为第j*类的测试图片与表示第j*类人脸的样本图片之间的相似度大于设定阈值,则通过基底变换法对该组样本子空间进行调整,生成一组新的样本子空间。本发明优点是实现了增量学习,在识别过程中能够充分利用已接触的信息,对识别结果进行改进。
-
公开(公告)号:CN101833565B
公开(公告)日:2011-10-19
申请号:CN201010137511.X
申请日:2010-03-31
Applicant: 南京大学
IPC: G06F17/30
Abstract: 本发明提供一种主动选择代表性图像的相关反馈方法,主要包括以下一系列步骤:(一)计算数据库中每张图像的评分;(二)按照评分从大到小排序,选择评分最大的图像供用户判断是否相关;(三)获得用户反馈结果后,重新计算数据库中图像的相关度;(四)依据新生成的图像相关度对图像排序,更新图像检索结果;(五)返回(一)或者结束。本发明利用机器学习中的主动学习思想,在选择相关反馈的候选图像时同时兼顾检索装置当前已经掌握的信息和对整个图像数据库的代表性,解决了之前相关反馈机制中候选图像随机获得或者只考虑片面因素的问题,从而显著提高相关反馈的效率。
-
公开(公告)号:CN101226521A
公开(公告)日:2008-07-23
申请号:CN200810020629.7
申请日:2008-02-18
Applicant: 南京大学
Abstract: 本发明公开了一种用于多义性数据对象进行预测建模的机器学习方法,该方法采用两层的分类结构,在第一层中利用聚类方法获得数据集的空间分布信息,然后在第二层中基于聚类结果训练生成相应的分类结构,最后利用训练所得的预测模型对新的数据对象进行预测,输出预测结果。本发明基于多示例多标记学习技术,可以有效地处理多义性对象。本发明解决了目前大部分建模方法只能处理单义性对象的局限,给出了一种从多义性对象中构造高性能预测模型的方法。
-
公开(公告)号:CN1234092C
公开(公告)日:2005-12-28
申请号:CN03132141.0
申请日:2003-07-01
Applicant: 南京大学
Inventor: 周志华
Abstract: 本发明公开了一种适用于计算机辅助医疗诊断的预测建模方法,包括通过医学症状检测设备获取待诊对象的症状形成症状向量,经预测模型处理,即可得到预测结果,该方法包括以下步骤:(1)若预测模型未训练好,则执行步骤(2),否则转到步骤(6);(2)利用历史病例产生初始训练数据集;(3)利用初始训练数据集训练出一个神经网络集成;(4)利用神经网络集成对初始训练数据集进行处理以产生规则训练数据集;(5)利用规则学习技术从规则训练数据集中产生规则模型;(6)利用规则模型进行预测并给出结果及解释。本发明的优点是为计算机辅助医疗诊断装置提供了一种高精度、高可理解性的预测建模方法。
-
公开(公告)号:CN1595427A
公开(公告)日:2005-03-16
申请号:CN200410041173.4
申请日:2004-07-05
Applicant: 南京大学
IPC: G06K9/00
Abstract: 本发明公开了一种基于选择性多本征空间集成的数字人脸图像识别方法,包括获得用于选择矩形特征的训练图像集和最佳矩形特征集合;获得目标人脸库;为每一个选择出来的矩形特征生成一个本征空间;生成待识别图像在最佳矩形特征集合所对应的各本征空间中的投影向量;计算待识别图像和目标人脸库中每一幅图像的最佳矩形特征集合的相似度;以最佳矩形特征集合相似度最大的目标人脸库图像对应的对象作为识别结果。本发明优点是:即使在待识别对象具有较大表情变化或者存在部分遮挡的情况下仍然能够较准确地进行识别,从而有助于提高数字人脸图像检测与识别装置的准确性与可靠性。
-
公开(公告)号:CN119625088A
公开(公告)日:2025-03-14
申请号:CN202411675479.9
申请日:2024-11-21
Applicant: 南京大学
IPC: G06T9/00 , G06V10/764 , G06V10/82 , G06N3/082
Abstract: 本发明公开一种面向分布外场景图像识别的稳健模型压缩方法,一方面使用训练数据微调模型参数,继承分布内样本表征能力,另一方面结合避免过拟合方法,使用稀疏优化筛选参数保证对分布外样本的泛化能力,技术易实现、通用性较强。主要步骤包括:预剪枝阶段在特征处理部分和最终分类层前加入Dropout,并引入L1正则项调整原模型结构,增强稀疏性的同时避免后续剪枝造成过拟合;剪枝阶段屏蔽Dropout层,使用泰勒展开式评估所有参数在置零前后对模型损失的影响大小作为重要性指标;基于评估结果和压缩比,去掉重要程度最低的参数;最后通过微调恢复模型性能。评估参数和微调同时进行,不断根据当前参数做出评估,以适应参数调整带来的重要性变化。
-
公开(公告)号:CN118747814A
公开(公告)日:2024-10-08
申请号:CN202410752041.X
申请日:2024-06-12
Applicant: 南京大学
IPC: G06V10/764 , G06N20/00
Abstract: 本发明公开一种面向流式数据的移动设备图片识别方法,首先从移动设备上获取流式图像数据并进行预处理;接着加载预训练模型,在流式数据上进行训练,并保存第一个任务学习结束后的模型参数,以作为后续任务学习前的模型初始化状态。同时存储维护在线模型、离线模型两组模型参数,其中离线模型的更新是基于模型融合的思想,在每次增量任务训练结束时计算并保留参数变动最显著的一部分,并将其添加到离线模型上,实现了资源的高效利用。最后在推理阶段,对在线模型和离线模型的输出进行集成,进一步提升了模型的识别能力。本发明方法在实施过程中并不需要对模型进行从零开始的学习,而是基于预训练模型进行微调,学习能力强,效率更高。
-
公开(公告)号:CN118709087A
公开(公告)日:2024-09-27
申请号:CN202410758487.3
申请日:2024-06-13
Applicant: 南京大学
IPC: G06F18/2431 , G06F18/214 , G06N3/0499 , G06N3/0895 , H04L9/40
Abstract: 本发明公开一种基于弱监督持续学习的边缘设备加密流量分类方法,首先获取已有的真实加密流量数据,包括少量的有标记数据和大量的无标记数据;随机初始化一个加密流量分类模型,然后利用当前加密流量数据训练模型并存储少量的核心有标记数据;当出现一批新类别的加密流量时,在旧模型基础上动态地分配计算资源分别用于使用新类流量的少量标注的有标记数据训练模型,充足的无标记数据训练模型以及所存储的其他旧类流量的核心有标记加密流量数据训练模型,并保存少量的核心有标记数据。本发明缓解标记数据的需求压力并解决新旧类别加密流量无法同时获得的难点,并且在实施过程中对资源要求较低且能充分利用有限的资源配额,易于在边缘设备进行部署。
-
-
-
-
-
-
-
-
-