-
公开(公告)号:CN109683946B
公开(公告)日:2021-12-03
申请号:CN201811521684.4
申请日:2018-12-13
Applicant: 南开大学
IPC: G06F8/71 , G06F40/253 , G06Q30/02 , G06N3/04 , G06N3/08
Abstract: 一种基于代码克隆技术的用户评论推荐方法,该方法结合代码克隆技术和用户评论推荐算法为新开发的软件或缺少用户评论的软件提供合理有效的评论。主要过程有:首先收集大量代码克隆数据,使用AST以及Word2Vec处理数据集中的代码对并将其表示为向量,基于向量进行CNN模型训练及保存;其次是用户评论阶段数据的收集及预处理,将用户基于插件输入的代码和用于评论推荐的代码组成代码对,采用代码克隆阶段相同的处理方法将代码对表示为向量;最后基于向量和保存的CNN模型进行相似度值的预测,最终为用户输入的代码段提供合理有效的用户评论。本发明解决了应用软件没有足够多有效用户评论的难题,为软件的进一步提升和改进提供更多有效的信息。
-
公开(公告)号:CN109683946A
公开(公告)日:2019-04-26
申请号:CN201811521684.4
申请日:2018-12-13
Applicant: 南开大学
CPC classification number: G06F8/71 , G06F17/2785 , G06N3/0454 , G06N3/084 , G06Q30/0282
Abstract: 一种基于代码克隆技术的用户评论推荐方法,该方法结合代码克隆技术和用户评论推荐算法为新开发的软件或缺少用户评论的软件提供合理有效的评论。主要过程有:首先收集大量代码克隆数据,使用AST以及Word2Vec处理数据集中的代码对并将其表示为向量,基于向量进行CNN模型训练及保存;其次是用户评论阶段数据的收集及预处理,将用户基于插件输入的代码和用于评论推荐的代码组成代码对,采用代码克隆阶段相同的处理方法将代码对表示为向量;最后基于向量和保存的CNN模型进行相似度值的预测,最终为用户输入的代码段提供合理有效的用户评论。本发明解决了应用软件没有足够多有效用户评论的难题,为软件的进一步提升和改进提供更多有效的信息。
-