一种领域本体构建方法及系统

    公开(公告)号:CN103218362A

    公开(公告)日:2013-07-24

    申请号:CN201210017772.7

    申请日:2012-01-19

    Abstract: 本发明公开一种领域本体构建方法,包括:罗列需要被目标本体描述的所有术语的名称,形成关键词集合W0;对关键词集合W0中的所有关键词进行排序,形成关键词序列S0;创建待复用的本体集合O,将从关键词序列S0中抽取的连续子序列中的所有关键词提交到本体检索系统,将检索结果中排名最高的本体添加到本体集合O;对本体集合O中的所有本体进行集合的并操作处理,形成新的本体o;本发明还提供一种领域本体构建系统。根据本发明的技术方案,提供一种面向本体检索的关键词查询的构建方法,具有良好的定义和可操作性,可取得较高的本体复用率。

    一种搜索方法及系统
    2.
    发明授权

    公开(公告)号:CN103425697B

    公开(公告)日:2017-09-26

    申请号:CN201210164223.2

    申请日:2012-05-24

    Abstract: 本发明提供一种搜索方法及系统,该方法包括:接收到查询的关键词集合后,根据预存的所有数据项分别计算每个关键词映射到每个数据字段的条件概率;根据所述关键词集合和所述所有的数据项查找出所有可行的查询转换;根据包括每条所述可行的查询转换中的所有关键词映射到对应数据字段的条件概率的预定规则,对所述可行的查询转换进行排序;按照排序后的查询转换搜索对应的数据项。本发明可以实现完全自动化并具有较高的准确率;可实现转换排序的自动演化以不断提升准确率;可增强候选转换的多样性。

    一种领域本体构建方法及系统

    公开(公告)号:CN103218362B

    公开(公告)日:2016-12-14

    申请号:CN201210017772.7

    申请日:2012-01-19

    Abstract: 本发明公开一种领域本体构建方法,包括:罗列需要被目标本体描述的所有术语的名称,形成关键词集合W0;对关键词集合W0中的所有关键词进行排序,形成关键词序列S0;创建待复用的本体集合O,将从关键词序列S0中抽取的连续子序列中的所有关键词提交到本体检索系统,将检索结果中排名最高的本体添加到本体集合O;对本体集合O中的所有本体进行集合的并操作处理,形成新的本体o;本发明还提供一种领域本体构建系统。根据本发明的技术方案,提供一种面向本体检索的关键词查询的构建方法,具有良好的定义和可操作性,可取得较高的本体复用率。

    一种搜索方法及系统
    4.
    发明公开

    公开(公告)号:CN103425697A

    公开(公告)日:2013-12-04

    申请号:CN201210164223.2

    申请日:2012-05-24

    Abstract: 本发明提供一种搜索方法及系统,该方法包括:接收到查询的关键词集合后,根据预存的所有数据项分别计算每个关键词映射到每个数据字段的条件概率;根据所述关键词集合和所述所有的数据项查找出所有可行的查询转换;根据包括每条所述可行的查询转换中的所有关键词映射到对应数据字段的条件概率的预定规则,对所述可行的查询转换进行排序;按照排序后的查询转换搜索对应的数据项。本发明可以实现完全自动化并具有较高的准确率;可实现转换排序的自动演化以不断提升准确率;可增强候选转换的多样性。

    基于检索的机器阅读理解系统的实现方法及装置

    公开(公告)号:CN112445887B

    公开(公告)日:2024-05-03

    申请号:CN201910808954.8

    申请日:2019-08-29

    Applicant: 南京大学

    Abstract: 基于检索的机器阅读理解系统的实现方法及装置,包括文本初步检索模块、检索结果重排序模块和机器阅读理解模块,文本初步检索模块被配置为事先构造领域文档集合,提取文档集合特征,将用户提出的问题和领域文档集合中的文档计算相似度,返回相似度最高的前x个文档给检索结果重排序模块,检索结果重排序模块根据所得x个文档与问题重新计算相关性,并将相关性最高的文档传导至机器阅读理解模块,机器阅读理解模块根据问题从最相关的文档中抽取出问题对应的答案。本发明针对用户的问题找到最相关的文档,将得到的文档和用户的问题交给机器阅读理解模型,最终得到问题对应的答案,构成了一个基于检索的机器阅读理解系统,提高问题类搜索的效率。

    一种基于神经网络的知识库问答中的属性匹配方法

    公开(公告)号:CN112445899A

    公开(公告)日:2021-03-05

    申请号:CN201910808206.X

    申请日:2019-08-29

    Applicant: 南京大学

    Abstract: 一种基于神经网络的知识库问答中的属性匹配方法,包含以下步骤:替换问句中的实体并根据实体生成候选属性,将其分词送入神经网络中的词嵌入层;利用双向LSTM学习上下问语义表示;根据问句和属性的词向量表示计算得到词义相似度矩阵,同理根据语义表示得到语义相似度矩阵;分别从问句方向和属性方向取两个相似度矩阵的最大值得到四个向量后,通过全联接层得到问句和属性的相似度;选择最高相似度及其对应的属性,若该相似度大于阈值,则加入属性,并替换问句中的文本进行下一轮属性匹配。本发明结合考虑问句和属性的上下文语义表示和词义表示来计算最终的相似度,提高了属性匹配的准确性;可以定位到问句中对应的谓词文本,迭代的处理多跳问题。

    基于生成模型辅助机器阅读理解的实现方法及装置

    公开(公告)号:CN114611510A

    公开(公告)日:2022-06-10

    申请号:CN202210285465.0

    申请日:2022-03-23

    Applicant: 南京大学

    Inventor: 程龚 吴傲 黄子贤

    Abstract: 基于生成模型辅助机器阅读理解的实现方法及装置,对选择题构建阅读理解模型,包括两个工作流,1)生成流,将问题输入编码器获得问题编码表示,再输入解码器获得答案解码表示,训练时根据正确选项计算teacher‑forcing损失;2)阅读理解流,将问题编码表示单独由解码器使用贪心策略生成问题扩展的向量表示,同时将问题分别拼接各选项后输入编码器,将对应输出的问题选项表示与扩展的向量表示交互融合,由所得融合结果获得每个选项对应的logit,训练时将这些logit与正确选项之间计算交叉熵损失,以teacher‑forcing损失和交叉熵损失结合起来对阅读理解模型进行训练优化。本发明使用单数据集训练,提高了对选择题的阅读理解准确率。

    一种图数据上的语义关联搜索的查询松弛方法

    公开(公告)号:CN113254718A

    公开(公告)日:2021-08-13

    申请号:CN202010089733.2

    申请日:2020-02-13

    Applicant: 南京大学

    Inventor: 李舒馨 程龚

    Abstract: 一种图数据上的语义关联搜索的查询松弛方法,包含以下步骤:给定实体关联图和直径约束,输入一组查询实体,分别计算它们的优先级,然后将 元组加入优先队列中,只要优先队列不为空,就取出队首元组,对查询实体进行验证,计算它满足距离条件的最大成功子查询集合,更新最优解;如果当前实体的优先级已经无法得出更优的解,则终止,完成查询。本发明解决了图数据上给定直径的情况下实体关联搜索结果为空的问题,对查询实体进行松弛,保证结果子查询可以找到关联。

    基于检索的机器阅读理解系统的实现方法及装置

    公开(公告)号:CN112445887A

    公开(公告)日:2021-03-05

    申请号:CN201910808954.8

    申请日:2019-08-29

    Applicant: 南京大学

    Abstract: 基于检索的机器阅读理解系统的实现方法及装置,包括文本初步检索模块、检索结果重排序模块和机器阅读理解模块,文本初步检索模块被配置为事先构造领域文档集合,提取文档集合特征,将用户提出的问题和领域文档集合中的文档计算相似度,返回相似度最高的前x个文档给检索结果重排序模块,检索结果重排序模块根据所得x个文档与问题重新计算相关性,并将相关性最高的文档传导至机器阅读理解模块,机器阅读理解模块根据问题从最相关的文档中抽取出问题对应的答案。本发明针对用户的问题找到最相关的文档,将得到的文档和用户的问题交给机器阅读理解模型,最终得到问题对应的答案,构成了一个基于检索的机器阅读理解系统,提高问题类搜索的效率。

    一种基于神经网络的知识库问答中的属性匹配方法

    公开(公告)号:CN112445899B

    公开(公告)日:2024-05-03

    申请号:CN201910808206.X

    申请日:2019-08-29

    Applicant: 南京大学

    Abstract: 一种基于神经网络的知识库问答中的属性匹配方法,包含以下步骤:替换问句中的实体并根据实体生成候选属性,将其分词送入神经网络中的词嵌入层;利用双向LSTM学习上下问语义表示;根据问句和属性的词向量表示计算得到词义相似度矩阵,同理根据语义表示得到语义相似度矩阵;分别从问句方向和属性方向取两个相似度矩阵的最大值得到四个向量后,通过全联接层得到问句和属性的相似度;选择最高相似度及其对应的属性,若该相似度大于阈值,则加入属性,并替换问句中的文本进行下一轮属性匹配。本发明结合考虑问句和属性的上下文语义表示和词义表示来计算最终的相似度,提高了属性匹配的准确性;可以定位到问句中对应的谓词文本,迭代的处理多跳问题。

Patent Agency Ranking