一种开放域多答案问答的实现方法、设备及存储介质

    公开(公告)号:CN116089592A

    公开(公告)日:2023-05-09

    申请号:CN202310277276.3

    申请日:2023-03-21

    Applicant: 南京大学

    Inventor: 程龚 赵悦 黄子贤

    Abstract: 一种开放域多答案问答的实现方法、设备及存储介质,包含三个阶段,稠密检索阶段,领域内预训练阶段及有监督多答案生成阶段,首先基于稠密检索模块从百科语料中找到相关段落,然后基于多段落阅读器对相关段落编码,基于多答案集合最优生成顺序训练答案生成器,得到回答该问题的多个答案。由于多答案数据集的标注成本过高,因此多答案数据集普遍偏小,本发明提出了领域内预训练来提升多答案生成的表现,多答案集合最优生成顺序策略缓解了多答案求解中一对多生成范式强制指定生成答案顺序带来的错误偏置。本发明在开放域多答案求解数据集上取得了比较好的效果。

    一种生成式知识问答方法及装置
    12.
    发明公开

    公开(公告)号:CN115221292A

    公开(公告)日:2022-10-21

    申请号:CN202110412948.8

    申请日:2021-04-16

    Applicant: 南京大学

    Abstract: 一种生成式知识问答方法及装置,将指定问答应用场景中的问题及其答案作为一个问答对,将问答对数据集按比例拆分为建库数据集和训练数据集,分别用于知识库自动化构建和答题模型训练,由答题模型和知识库对该指定问答应用场景下新的问题进行生成式知识问答。本发明使用生成式的问答系统,得到的答案更贴近自然语言,更流畅、更合理;本发明不需要借助人工构造的知识库,即可以对问题集进行事件图谱的自动化构建,并且很容易对建库数据集和训练数据集做扩充;本发明在实际领域数据的应用中超过了同类现有技术,并且整套方法相对于端到端的深度学习模型来说有更多的可解释性和模块化解耦,更适用于实际应用场景。

    基于分类检索的自动问答方法及系统

    公开(公告)号:CN107885844A

    公开(公告)日:2018-04-06

    申请号:CN201711107543.3

    申请日:2017-11-10

    Applicant: 南京大学

    Abstract: 基于分类检索的自动问答方法及系统,首先对一个简答类问题进行中文自然语言处理生成句法树,然后根据问句中的关键动词和连词将包含多个子问题的复杂问句拆分为语义更明确的、只包含单个问题的简单问句;接下来使用预定义的问句类型所对应的触发词对每个简单问句进行分类,并从问句中提取该类型问句模板所需的关键信息,对应填入模板槽中,形成包含所有解题所需信息的问句模板;然后根据问句模板的类型,从相对应的模板知识库中,根据模板槽中的关键信息对应模板知识库中的关键字进行检索,得到若干候选答案;最后,从候选答案中选取最优答案,作为简单问题的答案,然后将所有简单问题的答案进行综合,得出最终答案。

    一种搜索方法及系统
    14.
    发明授权

    公开(公告)号:CN103425697B

    公开(公告)日:2017-09-26

    申请号:CN201210164223.2

    申请日:2012-05-24

    Abstract: 本发明提供一种搜索方法及系统,该方法包括:接收到查询的关键词集合后,根据预存的所有数据项分别计算每个关键词映射到每个数据字段的条件概率;根据所述关键词集合和所述所有的数据项查找出所有可行的查询转换;根据包括每条所述可行的查询转换中的所有关键词映射到对应数据字段的条件概率的预定规则,对所述可行的查询转换进行排序;按照排序后的查询转换搜索对应的数据项。本发明可以实现完全自动化并具有较高的准确率;可实现转换排序的自动演化以不断提升准确率;可增强候选转换的多样性。

    一种地理知识图谱的构建方法、设备及存储介质

    公开(公告)号:CN116484015A

    公开(公告)日:2023-07-25

    申请号:CN202310307394.4

    申请日:2023-03-27

    Applicant: 南京大学

    Inventor: 程龚 董佳臣

    Abstract: 一种地理知识图谱的构建方法、设备及存储介质,获取地理数据源的数据,将区域数据转化为WKT格式并导出相关属性,对地理数据源数据中的实体进行实体对齐及属性融合,再对实体添加对应的自然地理属性后,构建得到地理知识图谱。本发明不局限于极少数较大范围的地点实体,将大多数常见地理实体均添加了区域类型的数据;改进了多数据源实体对齐的规则方法,修正了原有的一些错误合并不同地理实体的情况,以及相同地理实体未被合并的情况;针对地理实体对应的属性偏少,添加了土壤类型、每月平均风向等自然地理属性,以及人类发展指数、人均用电量等人文地理属性。

    中文自然语言问句语义化的知识库自动问答方法

    公开(公告)号:CN105701253B

    公开(公告)日:2019-03-26

    申请号:CN201610125710.6

    申请日:2016-03-04

    Applicant: 南京大学

    Abstract: 本发明公开了一种中文自然语言问句语义化的知识库自动问答方法,包括以下步骤:对用户输入的事实型问题进行中文自然语言处理,实现分词、词性标注、命名实体识别和扩展,生成语义依存树;使用泛化模板和语义解析技术获得问句中的时间、空间、事实主体、事实客体等组成成分,然后进行语义化处理,提取问句中所有事件相关的组成元素属性及其取值,生成多个“属性—取值”对,其中待回答的元素以疑问词代替,形成复杂事实三元组集合;待回答部分所在三元组联合其他相关事实三元组形成一个带条件约束的知识库查询,到知识库中进行基于相似度计算的查询匹配,从知识库中抽取结果,得到最终答案。本发明实现了对知识库的快速准确的查询应答。

    一种领域本体构建方法及系统

    公开(公告)号:CN103218362B

    公开(公告)日:2016-12-14

    申请号:CN201210017772.7

    申请日:2012-01-19

    Abstract: 本发明公开一种领域本体构建方法,包括:罗列需要被目标本体描述的所有术语的名称,形成关键词集合W0;对关键词集合W0中的所有关键词进行排序,形成关键词序列S0;创建待复用的本体集合O,将从关键词序列S0中抽取的连续子序列中的所有关键词提交到本体检索系统,将检索结果中排名最高的本体添加到本体集合O;对本体集合O中的所有本体进行集合的并操作处理,形成新的本体o;本发明还提供一种领域本体构建系统。根据本发明的技术方案,提供一种面向本体检索的关键词查询的构建方法,具有良好的定义和可操作性,可取得较高的本体复用率。

    一种搜索方法及系统
    18.
    发明公开

    公开(公告)号:CN103425697A

    公开(公告)日:2013-12-04

    申请号:CN201210164223.2

    申请日:2012-05-24

    Abstract: 本发明提供一种搜索方法及系统,该方法包括:接收到查询的关键词集合后,根据预存的所有数据项分别计算每个关键词映射到每个数据字段的条件概率;根据所述关键词集合和所述所有的数据项查找出所有可行的查询转换;根据包括每条所述可行的查询转换中的所有关键词映射到对应数据字段的条件概率的预定规则,对所述可行的查询转换进行排序;按照排序后的查询转换搜索对应的数据项。本发明可以实现完全自动化并具有较高的准确率;可实现转换排序的自动演化以不断提升准确率;可增强候选转换的多样性。

Patent Agency Ranking