一种基于标签迁移学习的推荐方法

    公开(公告)号:CN102591915A

    公开(公告)日:2012-07-18

    申请号:CN201110419665.2

    申请日:2011-12-15

    Applicant: 南京大学

    Abstract: 一种基于标签迁移学习的推荐方法,利用迁移技术解决标签数据稀疏的问题,迁移的知识是标签之间的关系,利用已有标签信息密集的数据集,聚类得到标签的topic,通过迁移学习的方式将标签的topic迁移到其他相关的但是标签信息相对稀疏的数据集上,然后根据迁移来的标签topic结合评分数据计算得到用户的相似度,最后利用协同过滤技术完成推荐。本发明提供的方法通过引入另外一个相似的但数据密集的领域的标签信息,来计算新领域的标签topic,从而提高计算用户相似性的准确性,进而达到更好的推荐效果。

    一种基于成分组装的文本测试用例生成方法

    公开(公告)号:CN118733447A

    公开(公告)日:2024-10-01

    申请号:CN202410786654.5

    申请日:2024-06-18

    Applicant: 南京大学

    Abstract: 本发明公开一种基于成分组装的文本测试用例生成方法,属于软件测试与程序分析领域。该方法首先将种子句子分解为基本结构和修饰语,然后对修饰语进行变异,创造更多符合当前句法结构的新修饰语,通过将新的修饰语依次插入基本结构,可以在种子句子的基础上生成多个具有不同结构和语义的新句子,新生成的句子之间具有派生关系和不同的变化程度,根据这些特点,测试人员可以很容易地为不同的NLP任务设计合适的蜕变关系来应用蜕变测试。本发明能有效缓解基准集和自然语言处理应用被评估能力的限制,减少测试数据缺失给NLP应用性能评估带来的影响,实现充分利用有限种子数据,产生更多有效且高质量的新测试用例。

    一种基于特征增强的微博话题检测方法

    公开(公告)号:CN110069703B

    公开(公告)日:2023-10-24

    申请号:CN201910219638.7

    申请日:2019-03-19

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于特征增强的微博话题检测方法。本发明针对微博话题检测存在的问题,从微博的时间特性和微博语义相似度出发对特征进行了增强,提升了Single‑Pass算法在微博话题检测场景下的表现。本发明通过将微博的时间特性融入到微博文本特征的相似度计算中,提高了属于同一话题的微博内容在时间维度上的关联度;通过使用分布式词向量表示微博,并利用其中的语义关系来增强微博关键特征,解决了微博特征稀疏的问题;为了减少了话题检测时微博与话题簇的比较次数,提出用于表示话题簇的“簇中心”概念,并围绕该概念进行计算。实验结果显示本发明简单易行,使用效果好,可以为微博话题检测提供实用方法。

    一种基于句法成分分析的自动化机器翻译测试方法

    公开(公告)号:CN113283250A

    公开(公告)日:2021-08-20

    申请号:CN202110581487.7

    申请日:2021-05-26

    Applicant: 南京大学

    Abstract: 一种基于句法成分分析的机器翻译自动化测试方法,其特征是使用句法成分分析获取句子的选区结构,并构建蜕变关系,无需参考文本即可评估机器翻译模型的性能。主要解决当前测试机器翻译的存在的依赖参考文本。准确性较低、内部参数不可理解、和测试预言难以构建的问题。选区反映了句子与其组成部分之间的整体关系,它通常用于描述句子的句法结构的特征。由于修饰词不能对句子的结构产生强烈的影响,给定句子的选区结构通常保留在其添加修饰语之后的句子的选区结构中,即选区不变性。本方法的步骤包括使用句子压缩模型生成文本扩增模板,使用BERT模型生成选区变体,使用选区解析树模型来表达句子结构,并基于选区不变性检测翻译错误。

    一种采用改进的人工蜂群算法的无线传感器部署方法

    公开(公告)号:CN105704729B

    公开(公告)日:2019-03-08

    申请号:CN201610046244.2

    申请日:2016-01-22

    Applicant: 南京大学

    Abstract: 采用改进的人工蜂群算法的无线传感器部署方法,应用于在一个给定的空间中部署无线传感器以达到最大的无线传感器覆盖,首先,指定需要部署无线传感器的区域,其次,指定无线传感器的覆盖半径和数量,最后,不断调整无线传感器的位置,已尽可能达到最大的无线传感器覆盖率;具体包含5个步骤:包括初始化步骤;雇佣蜂步骤:设置优化计数trail是为了在侦查蜂阶段选择无法再优化的食物源重新初始化而设置得到;计算选择概率步骤;跟随蜂步骤和侦查蜂步骤:侦查蜂步骤会通过食物源已进行邻居优化的尝试次数优化计数trail对食物源进行优化。

    基于覆盖度的错误定位技术的测试用例集优化方法

    公开(公告)号:CN102193864B

    公开(公告)日:2014-02-26

    申请号:CN201110126632.9

    申请日:2011-05-13

    Applicant: 南京大学

    Abstract: 基于覆盖度的错误定位技术的测试用例集优化方法,对于给定的测试用例集T,通过聚类从中识别偶然性正确测试用例,所述偶然性正确测试用例指错误语句被执行,但执行结果仍然为″通过″的测试用例,对识别出的偶然性正确的测试用例进行处理,得到优化的测试用例集用于基于覆盖度的错误定位。本发明的有益效果是:在约简了原测试用例集的大小的同时优化了测试用例集的质量,减少了偶然性正确的测试用例对基于覆盖度的错误定位的干扰作用,从而提高了自动化错误定位的效率和准确度,节省了程序员寻找错误的时间成本。

    一种基于标签迁移学习的推荐方法

    公开(公告)号:CN102591915B

    公开(公告)日:2013-09-11

    申请号:CN201110419665.2

    申请日:2011-12-15

    Applicant: 南京大学

    Abstract: 一种基于标签迁移学习的推荐方法,利用迁移技术解决标签数据稀疏的问题,迁移的知识是标签之间的关系,利用已有标签信息密集的数据集,聚类得到标签的topic,通过迁移学习的方式将标签的topic迁移到其他相关的但是标签信息相对稀疏的数据集上,然后根据迁移来的标签topic结合评分数据计算得到用户的相似度,最后利用协同过滤技术完成推荐。本发明提供的方法通过引入另外一个相似的但数据密集的领域的标签信息,来计算新领域的标签topic,从而提高计算用户相似性的准确性,进而达到更好的推荐效果。

    基于点的部分可观察马尔可夫决策过程的预处理方法

    公开(公告)号:CN101398914A

    公开(公告)日:2009-04-01

    申请号:CN200810194868.4

    申请日:2008-11-10

    Applicant: 南京大学

    Abstract: 本发明的基于点的部分可观察马尔可夫决策过程的预处理方法,包括如下步骤:1.迭代之前的预处理:a.通过与环境的随机交互来采样点集;b.计算并存储采样点的奖赏函数;c.计算并存储伪继承点;d.结束;2.每步迭代的预处理:e.计算并存储基向量;f.结束;3.单点单步迭代:g.计算每个采样点的奖赏值表和候选向量表;h.计算最优动作并获取基向量;i.用误差项修正基向量;j、结束。本发明的基于点的部分可观察马尔可夫决策过程的预处理方法对每个样本信念点作预处理,而且提出了基向量的概念,避免了大量重复和无意义计算,将算法速度提升了2~4倍。

Patent Agency Ranking