-
公开(公告)号:CN110297891A
公开(公告)日:2019-10-01
申请号:CN201910333734.4
申请日:2019-04-24
Applicant: 南京邮电大学
IPC: G06F16/332 , G06F17/27
Abstract: 一种面向程序设计答疑系统的知识库检索方法,获取学生检索的问题;系统对检索的问题和知识库中问题进行处理获取代码文本;再对代码文本进行预处理,将文本替换后获取标记串及文本属性度量向量;根据simhash算法对标记串分别进行词频计算,将词汇作为文本特征,词频作为特征的权重,计算出对应权重,并获取标记串的全文哈希值,根据哈希值计算出文本相似程度;根据文本属性度量向量计算出余弦相似度;根据标记串计算出文本匹配度;余弦相似度和文本匹配度通过Sim-win三权法计算出检索问题与知识库问题中的代码文本相似度,并将知识库中存储的问题由高到低排列。该方法通过加权的方式将sim-win三权法、Simhash算法和Winnowing算法融合,有效提升了代码文本相似度计算的准确率。
-
公开(公告)号:CN109977421A
公开(公告)日:2019-07-05
申请号:CN201910298906.9
申请日:2019-04-15
Applicant: 南京邮电大学
IPC: G06F17/27
Abstract: 一种程序设计类课程课后答疑系统的知识库建立方法,包括如下步骤,步骤S1、根据交互信息获取并整理收到问题语句;步骤S2、生成问题语句的词向量矩阵,并通过预设模型判断问题语句的问题类型;步骤S3、计算问题语句与同类型其他问题语句之间的语义相似度;步骤S4、根据语义相似度构建候选答案,再通过排序算法对候选答案进行排序,更新问题语句的知识库。该方法利用模型判断问题语句的类型,再根据同类语句之间语义相似度构建候选答案,最后通过排序算法排序候选答案构建问题的知识库,使课后答疑系统的表现更佳。
-
公开(公告)号:CN110866104A
公开(公告)日:2020-03-06
申请号:CN201911093183.5
申请日:2019-11-11
Applicant: 南京邮电大学
IPC: G06F16/332 , G06F16/33 , G06F16/31
Abstract: 本发明提出了一种针对程序设计类课程的自动化答疑方法,包括以下步骤:对若干用户提出的问题语句集和用户对所提问题的相应回答语句集行存储;将所述存储的问答数据语料的问题语句经训练转化为词向量,再将词向量进行组合得到词向量矩阵;前端获取用户提出的新问题;根据词向量矩阵构建新问题的问句向量;计算新问题语句与所存储问题语句集中每个问题语句的向量相似度,可得问句向量相似度集合;根据问句向量相似度集合构建答案,选出新问题语句与所存储的问题语句集中相似度最高的问句的答案进行回复,实现自动回答。本发明可以记录用户的问答内容并生成问答对,用以自动回复其他用户提出的重复问题,大大减轻了教师在答疑缓解中付出的重复劳动。
-
-