-
公开(公告)号:CN112346711A
公开(公告)日:2021-02-09
申请号:CN201910723480.7
申请日:2019-08-07
Applicant: 上海交通大学
Abstract: 一种用于语义识别的编程规范知识图谱的构建系统及方法,包括:信息抽取模块、关系发现模块、层次构建模块,其中:信息抽取模块从编程规范数据中抽取实体、属性及关系,关系发现模块从以抽取的实体中,进一步发掘知识图谱中编程规范实体之间的关系,层次构建模块对编程规范建立类型层次结构。本发明利用知识图谱的优势来解决程序员查找编程规范时遇到的问题,有效的整合了不同文档中的编程规范,具有良好的拓展性,同时构建了编程规范的层次结构,有利于程序员理解各个文档中的编程规范之间的关系。
-
公开(公告)号:CN112328800A
公开(公告)日:2021-02-05
申请号:CN201910717702.4
申请日:2019-08-05
Applicant: 上海交通大学
IPC: G06F16/36 , G06F8/33 , G06F16/332
Abstract: 一种自动生成编程规范问题答案的系统及方法,包括:子图匹配模块、机器阅读理解模块和学习排序模块,本发明通过构建编程规范知识图谱,通过子图匹配模块将自然语言问题转换为符合SPARQL协议的语句,利用编程规范知识图谱中结构化的信息查询得到候选答案。再通过机器阅读理解模块从自然语言问题中选取所有的名词、名词短语和主语,将这些词标记为关键词,使用Apache Solr引擎搜索得到最相关的10个自然段,并且使用基于TF‑IDF的算法对搜索得到的自然段进行打分,再对每个自然段使用训练好的深度学习模型得到候选答案,最后通过学习排序模块对候选答案进行合并生成新的候选答案,然后使用逻辑回归分类器按照正确的概率对新的候选答案进行排序。
-