-
公开(公告)号:CN115145928B
公开(公告)日:2024-08-16
申请号:CN202210914555.1
申请日:2022-08-01
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/22 , G06F16/2458 , G06F16/28 , G06F16/783
Abstract: 本说明书实施例提供了模型训练方法及装置、结构化摘要获取方法及装置。在针对结构化摘要模型的训练方法中,获取包括多轮对话的对话文本;将结构化摘要模型所应用的表单中的各个字段对应的字段标记添加至对话文本中,以得到带有字段标记的第一对话文本;按照第一对话文本中的各个字段标记的顺序,将各个字段对应的标签进行拼接,以得到标签文本,其中,标签文本中的相邻两个标签之间使用分隔符来隔离;以及使用第一对话文本和标签文本对结构化摘要模型进行训练。
-
公开(公告)号:CN115145928A
公开(公告)日:2022-10-04
申请号:CN202210914555.1
申请日:2022-08-01
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/22 , G06F16/2458 , G06F16/28 , G06F16/783
Abstract: 本说明书实施例提供了模型训练方法及装置、结构化摘要获取方法及装置。在针对结构化摘要模型的训练方法中,获取包括多轮对话的对话文本;将结构化摘要模型所应用的表单中的各个字段对应的字段标记添加至对话文本中,以得到带有字段标记的第一对话文本;按照第一对话文本中的各个字段标记的顺序,将各个字段对应的标签进行拼接,以得到标签文本,其中,标签文本中的相邻两个标签之间使用分隔符来隔离;以及使用第一对话文本和标签文本对结构化摘要模型进行训练。
-
公开(公告)号:CN115237922A
公开(公告)日:2022-10-25
申请号:CN202210914964.1
申请日:2022-08-01
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/22 , G06F16/28 , G06F16/2458 , G06F16/783
Abstract: 本说明书实施例提供了用于对结构化摘要模型进行训练的方法及装置。在该方法中,从结构化摘要模型所应用的表单中提取字段;按照表单中各个字段的填写难度对所提取的字段进行分类,以得到不同填写难度的字段类别;按照填写难度递增的字段类别顺序,对结构化摘要模型进行训练,直至针对字段类别顺序中的所有字段类别的训练完成:针对作为当前训练目标的目标字段类别,将目标字段类别以及比目标字段类别对应的填写难度更低的其他字段类别作为训练对象,使用对话样本数据以及各个训练对象对应的标签对结构化摘要模型进行训练;以及在针对目标字段类别的训练完成时,将字段类别顺序中的下一个字段类别确定为下一轮训练中的目标字段类别。
-
公开(公告)号:CN115271098A
公开(公告)日:2022-11-01
申请号:CN202210914562.1
申请日:2022-08-01
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N20/00 , G06F40/174 , G06F40/289
Abstract: 本说明书实施例提供了用于对训练样本进行分割的方法及装置。在该方法中,根据主题对作为训练样本的对话文本进行分割,以得到各个主题对应的对话段落,其中,作为训练样本的结构化的表单按照主题分成多个表单分块,每个表单分块对应一个主题;在各个主题包括的同一类型的事件能够多次发生时,将该主题对应的对话段落按照类型的事件进行分割,以得到各个事件对应的对话片段;将所得到的各个对话片段与该对话片段对应的表单分块中的子分块确定为对应关系;以及将各个对话片段与对应的子分块以及未分割的各个对话段落与对应的表单分块确定为训练样本。
-
-
-