-
公开(公告)号:CN112417149A
公开(公告)日:2021-02-26
申请号:CN202011258676.2
申请日:2020-11-11
Applicant: 北京工业大学
IPC: G06F16/35 , G06F40/216 , G06F40/242 , G06F40/284 , G06N3/04 , G06N3/08
Abstract: 本发明提出一种基于多任务学习的标题生成方法,首先获取需要进行标题生成的源文本数据,并且进行清洗等预处理,将文章送入Self‑Encoder端的BiLSTM模型进行特征提取,之后再通过TextRank算法以及多任务学习模块提取文章中的关键词,再将关键词送入Keywords‑Encoder端进行特征提取,然后将融合关键词信息和源文本信息的特征送入由BiLSTM组成的Decoder端。该网络更好的利用了原文中的关键词信息来进行标题生成,极大的丰富了特征提取的信息,提高了生成标题的质量。
-
公开(公告)号:CN112417149B
公开(公告)日:2024-03-19
申请号:CN202011258676.2
申请日:2020-11-11
Applicant: 北京工业大学
IPC: G06F16/35 , G06F40/216 , G06F40/242 , G06F40/284 , G06N3/0442 , G06N3/0464 , G06N3/047 , G06N3/08
Abstract: 本发明提出一种基于多任务学习的标题生成方法,首先获取需要进行标题生成的源文本数据,并且进行清洗等预处理,将文章送入Self‑Encoder端的BiLSTM模型进行特征提取,之后再通过TextRank算法以及多任务学习模块提取文章中的关键词,再将关键词送入Keywords‑Encoder端进行特征提取,然后将融合关键词信息和源文本信息的特征送入由BiLSTM组成的Decoder端。该网络更好的利用了原文中的关键词信息来进行标题生成,极大的丰富了特征提取的信息,提高了生成标题的质量。
-
公开(公告)号:CN112818106B
公开(公告)日:2024-04-16
申请号:CN202110184397.4
申请日:2021-02-10
Applicant: 北京工业大学
IPC: G06F16/332 , G06F16/33 , G06F16/35 , G06F40/253 , G06F40/289 , G06F40/30 , G06N3/0455 , G06N3/084
Abstract: 一种生成式问答的评价方法涉及自然语言处理领域。本发明针对生成式问答的答案在语言质量和语义准确度上存在的各种问题,分别构建数据集的正负样本。通过在数据集构建上进行处理,就能使问答评价网络在训练后能够结合语言质量和语义准确性两方面对生成的答案进行打分。相比传统的评价方法对答案的评价更全面、准确。
-
公开(公告)号:CN112818106A
公开(公告)日:2021-05-18
申请号:CN202110184397.4
申请日:2021-02-10
Applicant: 北京工业大学
IPC: G06F16/332 , G06F16/33 , G06F16/35 , G06F40/253 , G06F40/289 , G06F40/30 , G06N3/08
Abstract: 一种生成式问答的评价方法涉及自然语言处理领域。本发明针对生成式问答的答案在语言质量和语义准确度上存在的各种问题,分别构建数据集的正负样本。通过在数据集构建上进行处理,就能使问答评价网络在训练后能够结合语言质量和语义准确性两方面对生成的答案进行打分。相比传统的评价方法对答案的评价更全面、准确。
-
-
-