-
公开(公告)号:CN116522894A
公开(公告)日:2023-08-01
申请号:CN202310425111.6
申请日:2023-04-20
Applicant: 北京大学
IPC: G06F40/194 , G06F40/247 , G06F40/279 , G06F40/126 , G06F16/31 , G06F18/214
Abstract: 本发明公开了一种多阶段文本生成方法,其步骤包括:1)构建知识库2)构建多个样本,每一样本包括提示x、概念c和后续文本y,x与y构成一个标准故事,c来源于y中的词;故事生成模型包括知识检索模块、知识选择模块和故事生成模块;3)利用样本训练故事生成模型,知识检索模块根据输入样本中的提示x,根据数据库中检索出相似度最高的N条知识生成外部知识将x与c拼接得到联合提示x’,将x’和输入知识选择模块,生成输入信息中每个词的相关系数;故事生成模块根据各词的相关系数生成预测故事,优化模型参数;4)根据待生成的目标故事确定提示并将其输入训练后的故事生成模型,得到目标故事文本。本发明可生成长文本。