-
公开(公告)号:CN106844329A
公开(公告)日:2017-06-13
申请号:CN201610953505.9
申请日:2016-11-03
Applicant: 北京大学(天津滨海)新一代信息技术研究院
Abstract: 本发明公开了一种基于邮件列表的开源软件问答信息抽取方法。本方法为:1)从邮件归档服务器上爬取目标开源软件的邮件归档文件;依据邮件头部域将邮件归档文件分割成多封单独的邮件;2)将回复信息域为空的邮件设为一个会话的提问邮件,然后从得到的邮件中查找回复信息域的域值为该提问邮件的邮件标识ID的邮件,将其加入该会话;从而将同一主题下的邮件组织成邮件对话的形式;3)提取各邮件的正文信息并对邮件内容中代码元素进行标注;4)从提问邮件的正文信息中提取问题句及其上下文信息;然后基于问题句及其上下文信息和标注的代码元素构建查询条件,在该提问邮件的会话邮件中进行检索;然后从检索结果中选取一邮件作为回答信息。
-
公开(公告)号:CN108196880A
公开(公告)日:2018-06-22
申请号:CN201711307630.3
申请日:2017-12-11
Applicant: 北京大学
IPC: G06F8/74
Abstract: 本发明涉及一种软件项目知识图谱自动构造方法与系统。该方法包括:1)对原始软件资源数据进行解析,得到软件项目的基础知识实体及其关联,并以顶点和边的形式存储在图数据库中;2)在已有基础知识实体及其关联的基础上,采用知识提炼方法在实体之间建立新的关联,和/或在知识图谱中添加新的基础知识实体及其关联,并以顶点和边的形式存储在图数据库中;3)选择部分或全部基础知识实体及其关联,构成软件项目知识图谱。每种软件资源数据的解析方法以及知识提炼方法以插件形式存在,通过选择并运行需要的插件来生成软件项目知识图谱。本发明解决了从多源异构的软件资源中提取和组织领域特定知识的问题,适用范围广,可扩展性强。
-
公开(公告)号:CN110554860B
公开(公告)日:2021-03-12
申请号:CN201910804907.6
申请日:2019-08-29
Applicant: 北京大学
Abstract: 本发明公开了一种软件项目自然语言编程接口NLI的构造方法及代码生成方法。其中代码生成方法为:1)将软件项目的每一 封装为NLI中的一条原语,包括:原语的功能特征描述、API调用模式、宾语参数和其他参数;2)确定原语对应的抽象语法树节点类型;每个节点类型中规定了该类型节点拥有的子节点及属性;将节点的各子节点、属性与对应的Java代码文本区域绑定后,进行NLI原语参数补全过程中,投影编辑器生成代码的抽象语法树;3)从抽象语法树的根节点开始,递归式地对各节点进行转换,将抽象语法树节点中的属性与子节点安插至其API调用模式中空缺的部分,最终,生成原语对应的Java代码。
-
公开(公告)号:CN110554860A
公开(公告)日:2019-12-10
申请号:CN201910804907.6
申请日:2019-08-29
Applicant: 北京大学
Abstract: 本发明公开了一种软件项目自然语言编程接口NLI的构造方法及代码生成方法。其中代码生成方法为:1)将软件项目的每一 封装为NLI中的一条原语,包括:原语的功能特征描述、API调用模式、宾语参数和其他参数;2)确定原语对应的抽象语法树节点类型;每个节点类型中规定了该类型节点拥有的子节点及属性;将节点的各子节点、属性与对应的Java代码文本区域绑定后,进行NLI原语参数补全过程中,投影编辑器生成代码的抽象语法树;3)从抽象语法树的根节点开始,递归式地对各节点进行转换,将抽象语法树节点中的属性与子节点安插至其API调用模式中空缺的部分,最终,生成原语对应的Java代码。
-
-
-