一种从软件项目数据中提取知识图谱并问答的方法与系统

    公开(公告)号:CN108959433B

    公开(公告)日:2022-05-03

    申请号:CN201810597005.5

    申请日:2018-06-11

    Applicant: 北京大学

    Abstract: 本发明公开了一种从软件项目数据中提取知识图谱并问答的方法与系统。本方法为:对于软件项目数据库中每种类型的软件项目数据,从该类型的软件项目数据中提取出实体以及实体之间的关联关系,并存储到一对应的图数据库中;基于软件数据的可追踪性关联技术对各所述图数据库中的数据进行关联处理,得到不同类型软件项目数据的实体之间的关联关系;根据不同类型软件项目数据的实体之间的关联关系,在各图数据库中加入相应的边,对不同来源的实体进行连接,生成软件项目数据的知识图谱;对于输入的自然语言查询语句,从知识图谱中查询得到一匹配的连通子图作为答案。本发明解决了软件项目数据关联缺失、信息隔离现象严重、难以联立查询与分析的问题。

    一种从单元测试代码中提取API使用示例的方法与工具

    公开(公告)号:CN106569947A

    公开(公告)日:2017-04-19

    申请号:CN201610935694.7

    申请日:2016-11-01

    CPC classification number: G06F11/3684

    Abstract: 本发明公开了一种从单元测试代码中提取API使用示例的方法与工具。本方法为:1)构建软件项目的源代码的抽象语法树并从中提取出所有API方法的标识符;2)构建软件项目的测试代码的抽象语法树并获取其中的结构化信息;3)对每一测试用例的名称进行切分、词根化并索引;对API方法的名称进行切分、词根化并索引;4)计算任意一测试用例与任意一API方法间的相似度;将相似度最高的API方法判定为该测试用例的测试目标API;5)根据测试用例的抽象语法树构建一候选API使用示例集合;6)从该候选集合中选取API使用示例并将其添加至相应API方法的文档中。本发明为新发布的开源API提供丰富有用的API使用示例。

    一种从软件项目数据中提取知识图谱并问答的方法与系统

    公开(公告)号:CN108959433A

    公开(公告)日:2018-12-07

    申请号:CN201810597005.5

    申请日:2018-06-11

    Applicant: 北京大学

    CPC classification number: G06F8/75

    Abstract: 本发明公开了一种从软件项目数据中提取知识图谱并问答的方法与系统。本方法为:对于软件项目数据库中每种类型的软件项目数据,从该类型的软件项目数据中提取出实体以及实体之间的关联关系,并存储到一对应的图数据库中;基于软件数据的可追踪性关联技术对各所述图数据库中的数据进行关联处理,得到不同类型软件项目数据的实体之间的关联关系;根据不同类型软件项目数据的实体之间的关联关系,在各图数据库中加入相应的边,对不同来源的实体进行连接,生成软件项目数据的知识图谱;对于输入的自然语言查询语句,从知识图谱中查询得到一匹配的连通子图作为答案。本发明解决了软件项目数据关联缺失、信息隔离现象严重、难以联立查询与分析的问题。

    软件项目知识图谱自动构造方法与系统

    公开(公告)号:CN108196880A

    公开(公告)日:2018-06-22

    申请号:CN201711307630.3

    申请日:2017-12-11

    Applicant: 北京大学

    Abstract: 本发明涉及一种软件项目知识图谱自动构造方法与系统。该方法包括:1)对原始软件资源数据进行解析,得到软件项目的基础知识实体及其关联,并以顶点和边的形式存储在图数据库中;2)在已有基础知识实体及其关联的基础上,采用知识提炼方法在实体之间建立新的关联,和/或在知识图谱中添加新的基础知识实体及其关联,并以顶点和边的形式存储在图数据库中;3)选择部分或全部基础知识实体及其关联,构成软件项目知识图谱。每种软件资源数据的解析方法以及知识提炼方法以插件形式存在,通过选择并运行需要的插件来生成软件项目知识图谱。本发明解决了从多源异构的软件资源中提取和组织领域特定知识的问题,适用范围广,可扩展性强。

Patent Agency Ranking