基于检索的机器阅读理解系统的实现方法及装置

    公开(公告)号:CN112445887B

    公开(公告)日:2024-05-03

    申请号:CN201910808954.8

    申请日:2019-08-29

    Applicant: 南京大学

    Abstract: 基于检索的机器阅读理解系统的实现方法及装置,包括文本初步检索模块、检索结果重排序模块和机器阅读理解模块,文本初步检索模块被配置为事先构造领域文档集合,提取文档集合特征,将用户提出的问题和领域文档集合中的文档计算相似度,返回相似度最高的前x个文档给检索结果重排序模块,检索结果重排序模块根据所得x个文档与问题重新计算相关性,并将相关性最高的文档传导至机器阅读理解模块,机器阅读理解模块根据问题从最相关的文档中抽取出问题对应的答案。本发明针对用户的问题找到最相关的文档,将得到的文档和用户的问题交给机器阅读理解模型,最终得到问题对应的答案,构成了一个基于检索的机器阅读理解系统,提高问题类搜索的效率。

    一种基于神经网络的知识库问答中的属性匹配方法

    公开(公告)号:CN112445899A

    公开(公告)日:2021-03-05

    申请号:CN201910808206.X

    申请日:2019-08-29

    Applicant: 南京大学

    Abstract: 一种基于神经网络的知识库问答中的属性匹配方法,包含以下步骤:替换问句中的实体并根据实体生成候选属性,将其分词送入神经网络中的词嵌入层;利用双向LSTM学习上下问语义表示;根据问句和属性的词向量表示计算得到词义相似度矩阵,同理根据语义表示得到语义相似度矩阵;分别从问句方向和属性方向取两个相似度矩阵的最大值得到四个向量后,通过全联接层得到问句和属性的相似度;选择最高相似度及其对应的属性,若该相似度大于阈值,则加入属性,并替换问句中的文本进行下一轮属性匹配。本发明结合考虑问句和属性的上下文语义表示和词义表示来计算最终的相似度,提高了属性匹配的准确性;可以定位到问句中对应的谓词文本,迭代的处理多跳问题。

    基于生成模型辅助机器阅读理解的实现方法及装置

    公开(公告)号:CN114611510A

    公开(公告)日:2022-06-10

    申请号:CN202210285465.0

    申请日:2022-03-23

    Applicant: 南京大学

    Inventor: 程龚 吴傲 黄子贤

    Abstract: 基于生成模型辅助机器阅读理解的实现方法及装置,对选择题构建阅读理解模型,包括两个工作流,1)生成流,将问题输入编码器获得问题编码表示,再输入解码器获得答案解码表示,训练时根据正确选项计算teacher‑forcing损失;2)阅读理解流,将问题编码表示单独由解码器使用贪心策略生成问题扩展的向量表示,同时将问题分别拼接各选项后输入编码器,将对应输出的问题选项表示与扩展的向量表示交互融合,由所得融合结果获得每个选项对应的logit,训练时将这些logit与正确选项之间计算交叉熵损失,以teacher‑forcing损失和交叉熵损失结合起来对阅读理解模型进行训练优化。本发明使用单数据集训练,提高了对选择题的阅读理解准确率。

    一种图数据上的语义关联搜索的查询松弛方法

    公开(公告)号:CN113254718A

    公开(公告)日:2021-08-13

    申请号:CN202010089733.2

    申请日:2020-02-13

    Applicant: 南京大学

    Inventor: 李舒馨 程龚

    Abstract: 一种图数据上的语义关联搜索的查询松弛方法,包含以下步骤:给定实体关联图和直径约束,输入一组查询实体,分别计算它们的优先级,然后将 元组加入优先队列中,只要优先队列不为空,就取出队首元组,对查询实体进行验证,计算它满足距离条件的最大成功子查询集合,更新最优解;如果当前实体的优先级已经无法得出更优的解,则终止,完成查询。本发明解决了图数据上给定直径的情况下实体关联搜索结果为空的问题,对查询实体进行松弛,保证结果子查询可以找到关联。

    基于检索的机器阅读理解系统的实现方法及装置

    公开(公告)号:CN112445887A

    公开(公告)日:2021-03-05

    申请号:CN201910808954.8

    申请日:2019-08-29

    Applicant: 南京大学

    Abstract: 基于检索的机器阅读理解系统的实现方法及装置,包括文本初步检索模块、检索结果重排序模块和机器阅读理解模块,文本初步检索模块被配置为事先构造领域文档集合,提取文档集合特征,将用户提出的问题和领域文档集合中的文档计算相似度,返回相似度最高的前x个文档给检索结果重排序模块,检索结果重排序模块根据所得x个文档与问题重新计算相关性,并将相关性最高的文档传导至机器阅读理解模块,机器阅读理解模块根据问题从最相关的文档中抽取出问题对应的答案。本发明针对用户的问题找到最相关的文档,将得到的文档和用户的问题交给机器阅读理解模型,最终得到问题对应的答案,构成了一个基于检索的机器阅读理解系统,提高问题类搜索的效率。

    一种领域本体构建方法及系统

    公开(公告)号:CN103218362A

    公开(公告)日:2013-07-24

    申请号:CN201210017772.7

    申请日:2012-01-19

    Abstract: 本发明公开一种领域本体构建方法,包括:罗列需要被目标本体描述的所有术语的名称,形成关键词集合W0;对关键词集合W0中的所有关键词进行排序,形成关键词序列S0;创建待复用的本体集合O,将从关键词序列S0中抽取的连续子序列中的所有关键词提交到本体检索系统,将检索结果中排名最高的本体添加到本体集合O;对本体集合O中的所有本体进行集合的并操作处理,形成新的本体o;本发明还提供一种领域本体构建系统。根据本发明的技术方案,提供一种面向本体检索的关键词查询的构建方法,具有良好的定义和可操作性,可取得较高的本体复用率。

    一种基于神经网络的知识库问答中的属性匹配方法

    公开(公告)号:CN112445899B

    公开(公告)日:2024-05-03

    申请号:CN201910808206.X

    申请日:2019-08-29

    Applicant: 南京大学

    Abstract: 一种基于神经网络的知识库问答中的属性匹配方法,包含以下步骤:替换问句中的实体并根据实体生成候选属性,将其分词送入神经网络中的词嵌入层;利用双向LSTM学习上下问语义表示;根据问句和属性的词向量表示计算得到词义相似度矩阵,同理根据语义表示得到语义相似度矩阵;分别从问句方向和属性方向取两个相似度矩阵的最大值得到四个向量后,通过全联接层得到问句和属性的相似度;选择最高相似度及其对应的属性,若该相似度大于阈值,则加入属性,并替换问句中的文本进行下一轮属性匹配。本发明结合考虑问句和属性的上下文语义表示和词义表示来计算最终的相似度,提高了属性匹配的准确性;可以定位到问句中对应的谓词文本,迭代的处理多跳问题。

    一种知识图谱上的迭代式相关搜索方法

    公开(公告)号:CN114860849A

    公开(公告)日:2022-08-05

    申请号:CN202110158137.X

    申请日:2021-02-04

    Applicant: 南京大学

    Inventor: 李子扬 程龚

    Abstract: 一种知识图谱上的迭代式相关搜索方法,给定知识图谱、查询半径以及结果列表的长度,输出查询实体,得到半径内对应的元路径,然后得到覆盖元路径权重尽可能大的多样结果列表,根据用户标注的正负例得出每个元路径的相关度,并根据元路径相关度得到最相关的相关结果列表,进行相关结果列表的合并得到最终结果列表;用户对最终结果列表进行交互,选择标注正负例,根据用户的交互信息返回新一轮的结果;如果用户不想继续交互,完成本次搜索。本发明解决了相关搜索中用户不给定正例情况下无法得出结果,即“冷启动”的问题,在不清楚正负例的情况下通过交互逐步确定搜索结果,保证搜索系统的正常运转和结果的返回。

    中文自然语言问句语义化的知识库自动问答方法

    公开(公告)号:CN105701253A

    公开(公告)日:2016-06-22

    申请号:CN201610125710.6

    申请日:2016-03-04

    Applicant: 南京大学

    CPC classification number: G06F17/30666 G06F17/30684 G06F17/30731

    Abstract: 本发明公开了一种中文自然语言问句语义化的知识库自动问答方法,包括以下步骤:对用户输入的事实型问题进行中文自然语言处理,实现分词、词性标注、命名实体识别和扩展,生成语义依存树;使用泛化模板和语义解析技术获得问句中的时间、空间、事实主体、事实客体等组成成分,然后进行语义化处理,提取问句中所有事件相关的组成元素属性及其取值,生成多个“属性—取值”对,其中待回答的元素以疑问词代替,形成复杂事实三元组集合;待回答部分所在三元组联合其他相关事实三元组形成一个带条件约束的知识库查询,到知识库中进行基于相似度计算的查询匹配,从知识库中抽取结果,得到最终答案。本发明实现了对知识库的快速准确的查询应答。

    一种图数据上的语义关联搜索的查询松弛方法

    公开(公告)号:CN113254718B

    公开(公告)日:2023-08-29

    申请号:CN202010089733.2

    申请日:2020-02-13

    Applicant: 南京大学

    Inventor: 李舒馨 程龚

    Abstract: 一种图数据上的语义关联搜索的查询松弛方法,包含以下步骤:给定实体关联图和直径约束,输入一组查询实体,分别计算它们的优先级,然后将 元组加入优先队列中,只要优先队列不为空,就取出队首元组,对查询实体进行验证,计算它满足距离条件的最大成功子查询集合,更新最优解;如果当前实体的优先级已经无法得出更优的解,则终止,完成查询。本发明解决了图数据上给定直径的情况下实体关联搜索结果为空的问题,对查询实体进行松弛,保证结果子查询可以找到关联。

Patent Agency Ranking