-
公开(公告)号:CN112445899A
公开(公告)日:2021-03-05
申请号:CN201910808206.X
申请日:2019-08-29
Applicant: 南京大学
IPC: G06F16/332 , G06F16/33 , G06F40/30 , G06N3/04
Abstract: 一种基于神经网络的知识库问答中的属性匹配方法,包含以下步骤:替换问句中的实体并根据实体生成候选属性,将其分词送入神经网络中的词嵌入层;利用双向LSTM学习上下问语义表示;根据问句和属性的词向量表示计算得到词义相似度矩阵,同理根据语义表示得到语义相似度矩阵;分别从问句方向和属性方向取两个相似度矩阵的最大值得到四个向量后,通过全联接层得到问句和属性的相似度;选择最高相似度及其对应的属性,若该相似度大于阈值,则加入属性,并替换问句中的文本进行下一轮属性匹配。本发明结合考虑问句和属性的上下文语义表示和词义表示来计算最终的相似度,提高了属性匹配的准确性;可以定位到问句中对应的谓词文本,迭代的处理多跳问题。
-
公开(公告)号:CN110569368A
公开(公告)日:2019-12-13
申请号:CN201910861941.7
申请日:2019-09-12
Applicant: 南京大学
Abstract: 本发明公开了一种面向知识库问答的查询松弛方法,其特征在于,包括以下步骤:将无结果SPARQL语句进行分割,对查询条件进行分析,抽取待学习推理规则的谓词,组成谓词集合;针对上述步骤得到的谓词集合,获得其中每一个谓词的推理规则集合和置信度计算模型;基于上述步骤中所获得的推理规则集合,对相应的谓词进行补充,重组查询条件,查询候选结果;基于上述步骤所获得的置信度计算模型对所述候选结果打分、排序,保留部分高置信度结果作为最终结果,并输出令每条结果成立的推理规则。本发明实现了对无查询结果SPARQL语句的高效、准确的结果预测。
-
公开(公告)号:CN105260457B
公开(公告)日:2018-07-13
申请号:CN201510662906.4
申请日:2015-10-14
Applicant: 南京大学
IPC: G06F17/30
Abstract: 本发明公开了一种面向共指消解的多语义网实体对比表自动生成方法,包括以下步骤:给定一组候选共指实体,首先根据结构和文本信息来合并这组实体中语义相近的属性。接下来,基于合并后的属性及实体在属性上的取值分布对属性评分,并计算待选属性与已选属性的冗余度,从中挑选出一个高评分且低冗余的属性加入关键属性集合,重复本步骤直到选完预定数目的属性或无属性可选。最后,基于关键属性组织实体在关键属性上的取值,生成可视化实体对比表供用户参与实体共指消解。应用本发明能够提高用户参与多语义网实体共指消解的准确率和效率。
-
公开(公告)号:CN113190655B
公开(公告)日:2023-08-11
申请号:CN202110506597.7
申请日:2021-05-10
Applicant: 南京大学
IPC: G06F16/33 , G06F16/35 , G06F40/284 , G06F40/30 , G06F18/241 , G06N3/0455 , G06N3/045 , G06N3/048 , G06N3/08
Abstract: 一种基于语义依赖的空间关系抽取方法及装置,构建语义依赖识别模型,从非结构化文本中抽取出空间关系元组,首先定义语义依赖类型,分别为包含触发词角色类型和不包含触发词角色类型;然后将待识别文本及预标注的空间元素输入基于深度自注意力网络的语义依赖识别模型,结合定义的语义依赖类型,得到空间元素间的所有语义依赖识别结果;最后将得到的语义依赖识别结果进行组合,输出完整的空间关系元组。本发明将空间关系抽取问题转化为语义依赖识别问题,可同时处理多种空间关系,包括包含触发词和不含触发词的空间关系;本发明可以有效表示文本中的空间语义信息,抽取出空间元素间的语义依赖,无须人工设计特征,泛化性能强,准确率高。
-
公开(公告)号:CN111401073B
公开(公告)日:2023-06-09
申请号:CN202010155372.7
申请日:2020-03-09
Applicant: 南京大学
IPC: G06F40/30 , G06F18/2411 , G06F18/214
Abstract: 本发明公开了一种基于语义解析的时间表达式标准化方法。该方法为:首先构建时间表达式中的语义项,包括语义计算函数和语义值;然后使用训练集标注的时间表达式标准化值和其基准时间值,穷举其所有可能的语义组合;接着将时间表达式语义项分配问题建模为整数规划问题,通过优化算法完成底层语义项的自动分配;最后使用启发式规则自动组合语义项,解析待标准化的时间表达式语义,得到其标准化值。本发明无需手工分配与组合底层语义项,减少了人力成本,提高了时间表达式标准化的灵活性和泛化能力。
-
公开(公告)号:CN115221292A
公开(公告)日:2022-10-21
申请号:CN202110412948.8
申请日:2021-04-16
Applicant: 南京大学
IPC: G06F16/332 , G06F40/35 , G06F16/35 , G06F16/31
Abstract: 一种生成式知识问答方法及装置,将指定问答应用场景中的问题及其答案作为一个问答对,将问答对数据集按比例拆分为建库数据集和训练数据集,分别用于知识库自动化构建和答题模型训练,由答题模型和知识库对该指定问答应用场景下新的问题进行生成式知识问答。本发明使用生成式的问答系统,得到的答案更贴近自然语言,更流畅、更合理;本发明不需要借助人工构造的知识库,即可以对问题集进行事件图谱的自动化构建,并且很容易对建库数据集和训练数据集做扩充;本发明在实际领域数据的应用中超过了同类现有技术,并且整套方法相对于端到端的深度学习模型来说有更多的可解释性和模块化解耦,更适用于实际应用场景。
-
公开(公告)号:CN115114929A
公开(公告)日:2022-09-27
申请号:CN202210515296.5
申请日:2022-05-12
Applicant: 南京大学
IPC: G06F40/30 , G06F40/211 , G06F40/289
Abstract: 一种数量型属性比较类句子理解方法、设备及存储介质,包括输入预处理步骤、句子识别步骤、论元抽取步骤、输出生成步骤。首先输入预处理步骤会删除句子中与句子理解无关的内容,对句子进行词法、句法分析;然后句子识别步骤使用触发词、正则表达式和数量型属性词表对句子进行识别;其次论元抽取步骤根据句子模式和句法结构从句子中抽取论元;最后,输出生成步骤会识别句子中的时间地点信息,并对识别出的论元进行标准化,得到结构化数据。本发明提出了一种有效理解数量型属性比较类句子的方法,对数量型属性比较类句子进行理解,生成计算机可理解的结构化数据。本发明易于部署且可实用性强。
-
公开(公告)号:CN111309849A
公开(公告)日:2020-06-19
申请号:CN202010083902.1
申请日:2020-02-10
Applicant: 南京大学
IPC: G06F16/31 , G06F16/903 , G06F40/289 , G06F40/30 , G06F16/35 , G06N3/04
Abstract: 本发明公开了利用一种基于联合学习模型的细粒度数值信息抽取方法,包括如下步骤:对输入文本进行预处理;根据数值相关正则表达式识别候选的数值,以数值为触发词,与其前后词例拼接,作为联合学习模型的输入;联合学习模型的底层接入词嵌入层,并对词嵌入层的输出加入数值触发词的位置信息,得到每个词例最终的分布式表示;基于分布式表示接入后续的特征提取网络,并在高层分别接入具体任务的网络:接入分类网络得到数值信息的语义类型,接入序列标注网络得到数值触发词相关的数个语义角色;合并具体任务的输出得到数值信息单元;针对多个数值信息单元,基于统计方法判断它们之间的复合关系。本发明无需人工设计特征、准确性高、泛化能力强。
-
公开(公告)号:CN107885844A
公开(公告)日:2018-04-06
申请号:CN201711107543.3
申请日:2017-11-10
Applicant: 南京大学
CPC classification number: G06F17/30654 , G06F17/271 , G06F17/2775 , G06F17/2785 , G06F17/30684
Abstract: 基于分类检索的自动问答方法及系统,首先对一个简答类问题进行中文自然语言处理生成句法树,然后根据问句中的关键动词和连词将包含多个子问题的复杂问句拆分为语义更明确的、只包含单个问题的简单问句;接下来使用预定义的问句类型所对应的触发词对每个简单问句进行分类,并从问句中提取该类型问句模板所需的关键信息,对应填入模板槽中,形成包含所有解题所需信息的问句模板;然后根据问句模板的类型,从相对应的模板知识库中,根据模板槽中的关键信息对应模板知识库中的关键字进行检索,得到若干候选答案;最后,从候选答案中选取最优答案,作为简单问题的答案,然后将所有简单问题的答案进行综合,得出最终答案。
-
公开(公告)号:CN103425697B
公开(公告)日:2017-09-26
申请号:CN201210164223.2
申请日:2012-05-24
Applicant: 中兴通讯股份有限公司 , 南京大学
IPC: G06F17/30
Abstract: 本发明提供一种搜索方法及系统,该方法包括:接收到查询的关键词集合后,根据预存的所有数据项分别计算每个关键词映射到每个数据字段的条件概率;根据所述关键词集合和所述所有的数据项查找出所有可行的查询转换;根据包括每条所述可行的查询转换中的所有关键词映射到对应数据字段的条件概率的预定规则,对所述可行的查询转换进行排序;按照排序后的查询转换搜索对应的数据项。本发明可以实现完全自动化并具有较高的准确率;可实现转换排序的自动演化以不断提升准确率;可增强候选转换的多样性。
-
-
-
-
-
-
-
-
-