-
公开(公告)号:CN111813913A
公开(公告)日:2020-10-23
申请号:CN202010661187.5
申请日:2019-11-27
Applicant: 上海交通大学
IPC: G06F16/332 , G06F40/216 , G06F40/30 , G06F40/253 , G06N3/04 , G06N3/08 , G06Q50/20
Abstract: 一种以问题为导向的两阶段问题生成系统,包括:问答数据预处理模块、上下文序列标注模块和问题生成模块,其中:问答数据预处理模块对数据集进行了重新划分、特征提取及词典构建并将特征和单词向量化,得到标注训练集及真实标签;上下文序列标记模块采用标注数据集进行网络模型训练并得到上下文的预测标签;问题生成模块以真实标签和预测标签为输入产生预测问题序列,通过与真实问题的误差进行反向传播训练得到最终的最大概率预测问题。本发明在BLEU、MENTOR和ROUGE-L指标上有明显的提升。
-
公开(公告)号:CN111813913B
公开(公告)日:2024-02-20
申请号:CN202010661187.5
申请日:2019-11-27
Applicant: 上海交通大学
IPC: G06F16/332 , G06F40/216 , G06F40/30 , G06F40/253 , G06N3/0442 , G06N3/0455 , G06N3/047 , G06N3/0464 , G06N3/084 , G06Q50/20
Abstract: 一种以问题为导向的两阶段问题生成系统,包括:问答数据预处理模块、上下文序列标注模块和问题生成模块,其中:问答数据预处理模块对数据集进行了重新划分、特征提取及词典构建并将特征和单词向量化,得到标注训练集及真实标签;上下文序列标记模块采用标注数据集进行网络模型训练并得到上下文的预测标签;问题生成模块以真实标签和预测标签为输入产生预测问题序列,通过与真实问题的误差进行反向传播训练得到最终的最大概率预测问题。本发明在BLEU、MENTOR和ROUGE‑L指标上有明显的提升。
-