-
公开(公告)号:CN117807963A
公开(公告)日:2024-04-02
申请号:CN202410236990.2
申请日:2024-03-01
Applicant: 之江实验室
IPC: G06F40/166 , G06F16/35 , G06N20/00 , G06F18/24
Abstract: 本说明书公开了一种指定领域的文本生成方法及装置,对获取到的指定领域的原始文件进行数据清洗和格式转化得到目标文件,通过主题分类模型确定目标文件的目标主题,根据目标文件中的文本构建目标主题的问答对,问答对中的问题是目标文件中的标题文本,答案则是目标文件中的正文文本,根据目标主题对应的问答对优化预训练的自然语言模型的模型参数得到目标主题的文本生成模型,从而通过目标主题对应的文本生成模型,生成目标主题的输出文本。可见,通过上述方式,将提取到的领域知识融合入预训练的自然语言模型,提升了模型对指定领域的适用性,从而提高了输出文本的质量。
-
公开(公告)号:CN117807963B
公开(公告)日:2024-04-30
申请号:CN202410236990.2
申请日:2024-03-01
Applicant: 之江实验室
IPC: G06F40/166 , G06F16/35 , G06N20/00 , G06F18/24
Abstract: 本说明书公开了一种指定领域的文本生成方法及装置,对获取到的指定领域的原始文件进行数据清洗和格式转化得到目标文件,通过主题分类模型确定目标文件的目标主题,根据目标文件中的文本构建目标主题的问答对,问答对中的问题是目标文件中的标题文本,答案则是目标文件中的正文文本,根据目标主题对应的问答对优化预训练的自然语言模型的模型参数得到目标主题的文本生成模型,从而通过目标主题对应的文本生成模型,生成目标主题的输出文本。可见,通过上述方式,将提取到的领域知识融合入预训练的自然语言模型,提升了模型对指定领域的适用性,从而提高了输出文本的质量。
-