一种面向知识库问答的模板自动生成方法

    公开(公告)号:CN110532358A

    公开(公告)日:2019-12-03

    申请号:CN201910604477.3

    申请日:2019-07-05

    Applicant: 东南大学

    Abstract: 本发明提供的一种面向知识库问答的模板自动生成方法,包括关系词典构建过程,以及根据问题答案对自动生成问题模板和查询模板的过程。其中,关系词典构建过程是在大量语料的基础上,构建将自然语言短语对应到知识库关系的关系词典。根据问题答案对自动生成问题模板和查询模板的过程首先根据问题答案对,从知识库中获得查询图,将自然语言问题与查询图对齐,在对齐的基础上,自动生成问题模板和查询模板。本发明不依赖人工构建模板,能够解决知识库问答的模板自动生成问题,模板生成过程自动、高效,解决了传统人工模板构建方法的模板生成成本高、模板数量有限的问题,便于一系列后继应用(如自然语言知识库问答)的开展。

    针对少样本文本转SQL任务流的半监督持续学习方法

    公开(公告)号:CN115982586A

    公开(公告)日:2023-04-18

    申请号:CN202310025951.3

    申请日:2023-01-09

    Applicant: 东南大学

    Abstract: 本发明涉及一种针对少样本文本转SQL任务流的半监督持续学习方法,所述方法包括以下步骤:步骤1,对于新任务,模型使用任务内部的半监督学习进行训练,步骤2,对于任务流中过去的任务,模型使用持续学习将保持对已经学过的任务的记忆,步骤3,利用“教师‑学生”框架分别执行半监督学习过程与持续学习过程;步骤4,利用双重采样加强执行半监督学习与持续学习,分别包括提示采样和复习采样,加强两个学习过程的相互促进。该技术方案应用了“教师‑学生”框架来隔离半监督学习和持续学习的不同优化目标,并采用双重采样策略来加强它们之间的相互促进作用。

    一种面向知识库问答的模板自动生成方法

    公开(公告)号:CN110532358B

    公开(公告)日:2023-08-22

    申请号:CN201910604477.3

    申请日:2019-07-05

    Applicant: 东南大学

    Abstract: 本发明提供的一种面向知识库问答的模板自动生成方法,包括关系词典构建过程,以及根据问题答案对自动生成问题模板和查询模板的过程。其中,关系词典构建过程是在大量语料的基础上,构建将自然语言短语对应到知识库关系的关系词典。根据问题答案对自动生成问题模板和查询模板的过程首先根据问题答案对,从知识库中获得查询图,将自然语言问题与查询图对齐,在对齐的基础上,自动生成问题模板和查询模板。本发明不依赖人工构建模板,能够解决知识库问答的模板自动生成问题,模板生成过程自动、高效,解决了传统人工模板构建方法的模板生成成本高、模板数量有限的问题,便于一系列后继应用(如自然语言知识库问答)的开展。

    一种基于半监督学习和元学习的少样本NL2SQL方法

    公开(公告)号:CN114817307B

    公开(公告)日:2024-08-13

    申请号:CN202210147772.2

    申请日:2022-02-17

    Applicant: 东南大学

    Abstract: 本专利公开了一种基于半监督学习和元学习的少样本NL2SQL方法。本方法能在仅拥有少量标注数据的场景下,通过自训练框架的辅助对模型进行迭代训练,在这过程中逐步优化模型以及伪标签。首先对基础模型利用已有的少量标注数据进行热启动训练后,将其用于大量无标注数据的伪标签以及置信度预测,并使其与标签数据结合使对模型进行半监督学习。在半监督学习的过程中,同时引入元学习算法,它会在训练过程中进行任务采样,利用其特有任务训练机制来提升模型的快速学习以及迁移学习能力。最终得到的NL2SQL模型具有接近使用大量标注数据在有监督条件下训练的模型的准确率,同时针对新数据具有强大的少样本快速学习与微调的能力。

    一种基于半监督学习和元学习的少样本NL2SQL方法

    公开(公告)号:CN114817307A

    公开(公告)日:2022-07-29

    申请号:CN202210147772.2

    申请日:2022-02-17

    Applicant: 东南大学

    Abstract: 本专利公开了一种基于半监督学习和元学习的少样本NL2SQL方法。本方法能在仅拥有少量标注数据的场景下,通过自训练框架的辅助对模型进行迭代训练,在这过程中逐步优化模型以及伪标签。首先对基础模型利用已有的少量标注数据进行热启动训练后,将其用于大量无标注数据的伪标签以及置信度预测,并使其与标签数据结合使对模型进行半监督学习。在半监督学习的过程中,同时引入元学习算法,它会在训练过程中进行任务采样,利用其特有任务训练机制来提升模型的快速学习以及迁移学习能力。最终得到的NL2SQL模型具有接近使用大量标注数据在有监督条件下训练的模型的准确率,同时针对新数据具有强大的少样本快速学习与微调的能力。

Patent Agency Ranking