-
公开(公告)号:CN110069703B
公开(公告)日:2023-10-24
申请号:CN201910219638.7
申请日:2019-03-19
Applicant: 南京大学
IPC: G06F16/9535 , G06F16/9536 , G06F16/35 , G06F40/289 , G06F40/30 , G06Q50/00
Abstract: 本发明公开了一种基于特征增强的微博话题检测方法。本发明针对微博话题检测存在的问题,从微博的时间特性和微博语义相似度出发对特征进行了增强,提升了Single‑Pass算法在微博话题检测场景下的表现。本发明通过将微博的时间特性融入到微博文本特征的相似度计算中,提高了属于同一话题的微博内容在时间维度上的关联度;通过使用分布式词向量表示微博,并利用其中的语义关系来增强微博关键特征,解决了微博特征稀疏的问题;为了减少了话题检测时微博与话题簇的比较次数,提出用于表示话题簇的“簇中心”概念,并围绕该概念进行计算。实验结果显示本发明简单易行,使用效果好,可以为微博话题检测提供实用方法。
-
公开(公告)号:CN110019677A
公开(公告)日:2019-07-16
申请号:CN201711263641.6
申请日:2017-11-30
Applicant: 南京大学
IPC: G06F16/33 , G06F16/9535 , G06F17/27
Abstract: 本发明公开了基于聚类分析的微博广告发布者识别方法及装置,该微博广告识别方法对于用户维度,针对微博广告发布者通过发布大量普通微博来稀释其广告内容的现象,提出核心微博的概念,通过提取核心微博主题及其对应的微博序列,以此计算用户特征和对应微博的文本特征,并使用聚类算法对特征进行聚类,从而识别其中的微博广告发布者。实验结果显示该方法具有很高的准确率,证明该方法在广告内容被人为稀释的情况下能准确地识别微博广告发布者,可以为微博垃圾信息识别、清理等工作提供实用方法。
-
公开(公告)号:CN105678297A
公开(公告)日:2016-06-15
申请号:CN201511028331.7
申请日:2015-12-29
Applicant: 南京大学
CPC classification number: G06K9/3241 , G06K9/4685 , G06K9/6269
Abstract: 本发明提供了根据标签转移及时间递归神经网络模型的人像图片语义分析的方法及系统,包括以下步骤。1、基于显著性检测的方法提取可能包含人像的矩形区域。2、根据候选区域的位置信息聚类,并进行筛选。3、对剩下区域进行人像检测,确定人像区域。5、对最终区域进行超像素分割,然后选择性地迭代合并超像素。6、制作人体标准分割标注模板,根据位置信息计算标签转移概率,并结合支持向量机完成分割区域标注。7、将训练图片人像的语义描述做样本,训练LSTM(时间递归神经网络)模型。8、根据人像分割区域的标注和颜色构建描述词组,加入辅助性词组,利用模型生成描述语句。通过上诉方法可以得到人像图片的细粒度的标注信息和自然的语义描述。
-
公开(公告)号:CN110069703A
公开(公告)日:2019-07-30
申请号:CN201910219638.7
申请日:2019-03-19
Applicant: 南京大学
IPC: G06F16/9535 , G06F16/9536 , G06F16/35 , G06F17/27 , G06Q50/00
Abstract: 本发明公开了一种基于特征增强的微博话题检测方法。本发明针对微博话题检测存在的问题,从微博的时间特性和微博语义相似度出发对特征进行了增强,提升了Single-Pass算法在微博话题检测场景下的表现。本发明通过将微博的时间特性融入到微博文本特征的相似度计算中,提高了属于同一话题的微博内容在时间维度上的关联度;通过使用分布式词向量表示微博,并利用其中的语义关系来增强微博关键特征,解决了微博特征稀疏的问题;为了减少了话题检测时微博与话题簇的比较次数,提出用于表示话题簇的“簇中心”概念,并围绕该概念进行计算。实验结果显示本发明简单易行,使用效果好,可以为微博话题检测提供实用方法。
-
公开(公告)号:CN109858008A
公开(公告)日:2019-06-07
申请号:CN201711263320.6
申请日:2017-11-30
Applicant: 南京大学
IPC: G06F17/27
Abstract: 本发明公开了基于深度学习的文书判决结果倾向性的方法及装置,该文本倾向性分析方法能够从非结构化的文本中提取关键特征,利用模糊匹配方法解决判决结果中的多实体识别的问题,通过基于多层LSTM的深度神经网络进行倾向性判断,将整个过程构建成一个针对判决结果的倾向性分析模型。将该模型在不同案由的裁判文书数据集上都达到很高的准确率。通过该方法,只需输入裁判文书,即可得到判决结果倾向性标签,中间步骤无需人工参与,省时省力。
-
公开(公告)号:CN102063374A
公开(公告)日:2011-05-18
申请号:CN201110003162.7
申请日:2011-01-07
Applicant: 南京大学
IPC: G06F11/36
Abstract: 一种使用半监督信息进行聚类的回归测试用例选择方法,记录测试用例的执行覆盖信息,生成函数执行剖面,以量化形式表示测试用例;通过对历史测试结果的分析,获得测试用例之间的约束关系并应用半监督聚类算法分析测试用例,了解它们执行情况的异同,理解程序行为及测试用例之间的联系,在回归测试阶段有效降低测试用例数量并保持足够高的错误检测能力。本发明基于数据挖掘技术,通过测试用例所展现出的程序行为的内在联系来理解程序,使得测试用例的选择变得更加容易和自动化,从而可以更有效的使用这些测试用例进行回归测试,提高了测试用例选择的精确度,提高了回归测试的效率。
-
-
-
-
-