-
公开(公告)号:CN111460401A
公开(公告)日:2020-07-28
申请号:CN202010431048.3
申请日:2020-05-20
Applicant: 南京大学
IPC: G06F21/16 , G06F40/216 , G06K9/62
Abstract: 本发明属于计算机技术领域,具体涉及一种结合软件制品过程信息和文本相似度的制品自动追踪方法,包括:选择制品,挖掘待关联制品间的追踪关系,划分显隐式追踪关系;抽取待关联制品的过程信息;计算待关联制品间的文本相似度;为显式追踪关系的制品选定过程特征及关系结果标签;隐式追踪关系的制品间的追踪关系人工打标签,并借助中间制品增加相关特征;预处理数据,获取样本集,选择机器学习分类算法,训练模型,预测制品间是否存在追踪关系。本发明从过程数据出发,解决了信息检索方法受限于文本质量以及词汇失配的问题,且可以追踪多种制品间的追踪关系。本发明相较于传统依赖文本相似度的信息检索方法,精确率和召回率均有大幅度提升。
-
公开(公告)号:CN111460401B
公开(公告)日:2023-08-22
申请号:CN202010431048.3
申请日:2020-05-20
Applicant: 南京大学
IPC: G06F21/16 , G06F40/216 , G06F18/22 , G06F18/243
Abstract: 本发明属于计算机技术领域,具体涉及一种结合软件制品过程信息和文本相似度的制品自动追踪方法,包括:选择制品,挖掘待关联制品间的追踪关系,划分显隐式追踪关系;抽取待关联制品的过程信息;计算待关联制品间的文本相似度;为显式追踪关系的制品选定过程特征及关系结果标签;隐式追踪关系的制品间的追踪关系人工打标签,并借助中间制品增加相关特征;预处理数据,获取样本集,选择机器学习分类算法,训练模型,预测制品间是否存在追踪关系。本发明从过程数据出发,解决了信息检索方法受限于文本质量以及词汇失配的问题,且可以追踪多种制品间的追踪关系。本发明相较于传统依赖文本相似度的信息检索方法,精确率和召回率均有大幅度提升。
-
公开(公告)号:CN113326348A
公开(公告)日:2021-08-31
申请号:CN202110591333.6
申请日:2021-05-28
Applicant: 南京大学
IPC: G06F16/33 , G06F16/34 , G06F16/383 , G06F40/211 , G06F40/253 , G06F40/289 , G06F40/30 , G06Q10/06
Abstract: 本发明公开了一种博客质量评估方法及工具,其中本方法具体包括博客的搜索、博客质量的定量分析,博客质量的综合分析以及灰色文献评估标准权重生成;其中通过该方法构建了一个博客评估工具,所述工具包含由搜索博客并处理博客数据构成的博客搜索模块;由博客质量定量和综合分析构成的博客质量评估模块;由博客质量评估标准修改和灰色文献评估标准权重生成构成的权重计算模块。本发明实现了灰色文献评估标准的权重计算以及博客搜索和质量评估的流程的自动化,方便研究人员在研究过程中应用博客,并帮助从业人员在实践中获取高质量博客中的同行的经验和观点。
-
-