-
公开(公告)号:CN115293147A
公开(公告)日:2022-11-04
申请号:CN202210916980.4
申请日:2022-08-01
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供信息提取方法及装置,其中所述信息提取方法包括:获取待处理文本和所述待处理文本对应的标记信息;基于所述标记信息对所述待处理文本进行数据预处理,获得待处理标记文本;将所述待处理标记文本输入至信息提取模型进行信息提取,获取所述信息提取模型输出的初始文本信息;将所述初始文本信息输入至信息校正模型进行信息校正,获取所述信息校正模型输出的目标文本信息。通过包括自回归解码器的信息提取模型可以结合上下文信息与当前轮语句直接预测出关键信息,并通过包括有非自回归解码器的信息校正模型对信息提取模型的预测结果进行校正处理,使得生成的目标文本信息更为准确,提高后续保险人员的作业效率。
-
公开(公告)号:CN115271098A
公开(公告)日:2022-11-01
申请号:CN202210914562.1
申请日:2022-08-01
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N20/00 , G06F40/174 , G06F40/289
Abstract: 本说明书实施例提供了用于对训练样本进行分割的方法及装置。在该方法中,根据主题对作为训练样本的对话文本进行分割,以得到各个主题对应的对话段落,其中,作为训练样本的结构化的表单按照主题分成多个表单分块,每个表单分块对应一个主题;在各个主题包括的同一类型的事件能够多次发生时,将该主题对应的对话段落按照类型的事件进行分割,以得到各个事件对应的对话片段;将所得到的各个对话片段与该对话片段对应的表单分块中的子分块确定为对应关系;以及将各个对话片段与对应的子分块以及未分割的各个对话段落与对应的表单分块确定为训练样本。
-
公开(公告)号:CN112925894B
公开(公告)日:2022-07-05
申请号:CN202110331055.0
申请日:2021-03-26
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06F16/33
Abstract: 本说明书实施例公开了一种对话中标问匹配方法、系统以及装置。其中,所述方法包括获取用户话语以及与所述用户话语对应的至少一个候选标问;获取对话状态跟踪信息,所述对话状态跟踪信息至少包括基于对话上文确定的与所述用户话语相关的关键词和/或意图;至少基于所述用户话语、所述至少一个候选标问以及所述对话状态跟踪信息,利用匹配模型,分别确定对应于每个候选标问的评估值;基于每一个候选标问的评估值,确定对应于所述用户话语的目标标问。通过使用用户对话中的对话状态跟踪信息来增加标准问题的匹配依据,提高对应于用户话语的目标问题匹配精度。
-
公开(公告)号:CN116860945A
公开(公告)日:2023-10-10
申请号:CN202310887756.1
申请日:2023-07-19
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06N5/00
Abstract: 本说明书实施例提供基于隐式反馈信息的缺陷对话检测方法及装置。在进行缺陷对话检测时,获取待检测对话的对话交互数据;从对话交互数据中提取出隐式反馈信息,所述隐式反馈信息用于隐式反馈对话机器人回复答案正确与否;以及使用隐式反馈信息来对待检测对话进行缺陷检测。
-
公开(公告)号:CN115237922A
公开(公告)日:2022-10-25
申请号:CN202210914964.1
申请日:2022-08-01
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/22 , G06F16/28 , G06F16/2458 , G06F16/783
Abstract: 本说明书实施例提供了用于对结构化摘要模型进行训练的方法及装置。在该方法中,从结构化摘要模型所应用的表单中提取字段;按照表单中各个字段的填写难度对所提取的字段进行分类,以得到不同填写难度的字段类别;按照填写难度递增的字段类别顺序,对结构化摘要模型进行训练,直至针对字段类别顺序中的所有字段类别的训练完成:针对作为当前训练目标的目标字段类别,将目标字段类别以及比目标字段类别对应的填写难度更低的其他字段类别作为训练对象,使用对话样本数据以及各个训练对象对应的标签对结构化摘要模型进行训练;以及在针对目标字段类别的训练完成时,将字段类别顺序中的下一个字段类别确定为下一轮训练中的目标字段类别。
-
公开(公告)号:CN113283995B
公开(公告)日:2022-07-12
申请号:CN202110553757.3
申请日:2021-05-20
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06Q40/08 , G06Q50/18 , G06F40/295 , G06F40/242
Abstract: 本说明书实施例公开了一种保险公估远程访问纪要方法、装置以及设备。方案包括:获取公估方与理赔方在访问过程中的音频信息,并将音频信息转换为文本信息;确定文本信息中对应于公估方的第一文本信息被识别为有效问题;通过预先训练的话题检测模型确定文本信息在保险公估过程中所处的阶段,并在文本信息中提取出相应的实体信息;将实体信息与预先生成的知识库中的实体关联,根据关联成功的知识库中的实体确定相应的关键词,并根据关键词辅助生成所处的阶段对应的保险公估表单。
-
公开(公告)号:CN114638217A
公开(公告)日:2022-06-17
申请号:CN202210246775.1
申请日:2022-03-14
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/279 , G06F16/33 , G06N5/02
Abstract: 本说明书实施例提供了地址文本处理方法及装置,其中,一种地址文本处理方法包括:获取对语音数据进行识别获得的地址文本,对所述地址文本进行切分处理获得地址关键词;对所述地址关键词进行层级标注,并基于层级标注结果搜索与所述地址关键词匹配的标准地址关键词;根据所述地址文本、所述地址关键词以及所述标准地址关键词,构建地址层级关系图;利用所述地址层级关系图计算所述地址关键词以及处于各候选地址链路的所述标准地址关键词的权重,并根据所述权重计算所述各候选地址链路的链路权重;根据所述各候选地址链路的链路权重确定所述地址文本对应的目标地址链路。
-
公开(公告)号:CN117573816A
公开(公告)日:2024-02-20
申请号:CN202310835504.4
申请日:2023-07-07
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06F16/9032 , G06N5/02
Abstract: 本说明书实施例提供一种问答数据生成方法、装置、设备与存储介质,该方法包括:通过获取服务对话数据中的无答案问题数据和目标回答数据,从服务对话数据中确认与无答案问题数据关联的第一对话数据,确认与目标回答数据关联的第二对话数据,基于第一对话数据和无答案问题数据,确认与无答案问题数据匹配的答案数据,基于第二对话数据和目标回答数据,确认与目标回答数据匹配的目标问题数据,基于无答案问题数据、答案数据、目标回答数据和目标问题数据生成问答数据。
-
公开(公告)号:CN116842162A
公开(公告)日:2023-10-03
申请号:CN202310887518.0
申请日:2023-07-19
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06N5/04
Abstract: 本说明书实施例提供用于对话机器人的知识库优化方法及装置。响应于缺陷对话的缺陷类型指示对话机器人未返回正确答案且正确答案存在于对话机器人的知识库中,基于多模型融合方式来从知识库的至少一个候选答案中确定缺陷对话的用户问题的正确答案;以及将用户问题挂载到所确定出的正确答案所在知识点的扩展问列表。响应于缺陷类型指示对话机器人未返回正确答案且正确答案未存在于知识库中,根据用户问题执行基于知识点创建的知识库优化。
-
公开(公告)号:CN113094491A
公开(公告)日:2021-07-09
申请号:CN202110540695.2
申请日:2021-05-18
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06F16/35 , G06F40/289 , G06F40/30 , G06K9/62 , G06N20/00 , G06Q30/02
Abstract: 本说明书涉及智能客服技术领域,特别涉及一种业务障碍识别方法和系统。该方法包括:获取多个用户的行为轨迹和用户原声;所述行为轨迹包括用户在业务平台内的一个或多个轨迹节点;确定各用户原声关联的轨迹节点;确定各用户原声所属的障碍类型;所述障碍类型至少反映用户在以下一个或多个方面的障碍:信息获取、业务认知、操作以及互动;基于各用户原声关联的轨迹节点以及各用户原声所属的障碍类型,确定各轨迹节点处各障碍类型被用户原声命中的频次。
-
-
-
-
-
-
-
-
-