-
公开(公告)号:CN112115268B
公开(公告)日:2024-04-09
申请号:CN202011039098.3
申请日:2020-09-28
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供了一种基于特征编码器的训练方法及装置、分类方法及装置。在该方法中,获取当前训练样本,将当前训练样本以及用于分类的多个文本类别分别输入特征编码器,输出各个当前训练样本对应的样本特征向量以及多个文本类别对应的分类矩阵;基于输出的样本特征向量以及分类矩阵得到当前训练样本针对各个文本类别的预测值;以及在不满足循环结束条件时,根据所得到的预测值和当前训练样本的真实分类类别对特征编码器的编码器参数进行调整,调整后的特征编码器作为下一次循环的特征编码器。
-
公开(公告)号:CN111309878B
公开(公告)日:2023-08-22
申请号:CN202010059894.7
申请日:2020-01-19
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06F16/33
Abstract: 本说明书提供一种检索式问答方法,包括:对接收的第一文本进行分词,得到至少一个第一词语;确定所述至少一个第一词语的词权重;根据所述至少一个第一词语从知识库召回至少一个候选问题‑答案对;针对每个候选问题‑答案对,分别将候选问题‑答案对中的问题作为第二文本,确定所述第二文本包含的至少一个第二词语及其词权重;根据所述至少一个第一词语、所述至少一个第二词语及其词权重确定第一文本和候选问题‑答案对中每个问题的匹配度;根据确定的匹配度返回至少一个候选问题‑答案对中的答案。本说明书还提供了实现了检索式问答的服务器、电子设备以及计算机可读存储介质。
-
公开(公告)号:CN111428023B
公开(公告)日:2023-07-14
申请号:CN202010224908.6
申请日:2020-03-26
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/335 , G06F16/332 , G06N3/0442 , G06N3/0464 , G06N3/08
Abstract: 本说明书实施例提出了一种话术推荐方法、装置和电子设备,其中,上述话术推荐方法中,获取当前对话中用户输入的对话内容之后,根据上述用户输入的对话内容,通过预先训练的话术推荐模型,生成上述对话内容对应的回答话术,然后在上述当前对话中输出上述回答话术。由于上述话术推荐模型是利用用户模拟内容和上述用户模拟内容对应的回答话术组成的对话语料训练获得的,上述用户模拟内容是模拟用户说的内容,对应的回答话术是机器人针对上述用户模拟内容给出的答复。
-
公开(公告)号:CN111552787B
公开(公告)日:2023-06-30
申请号:CN202010328553.5
申请日:2020-04-23
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06F16/33 , G06F16/35 , G06F40/289 , G06F40/35 , G06N3/0442 , G06N3/0464 , G06N3/08
Abstract: 本说明书实施例公开了一种问答处理方法、装置、设备及存储介质,获取用户问题匹配的候选对话记录集,针对候选对话记录集中每段对话记录,以用户问题替换对话记录的代表问题,得到待分类的文本对象,并通过文本分类模型对文本对象进行分类,得到表征用户问题与对话记录之间的匹配程度文本对象的文本分类结果,根据每个文本对象的文本分类结果,从候选对话记录集选出目标对话记录,并将目标对话记录提供给当前提问用户。
-
公开(公告)号:CN111651582B
公开(公告)日:2023-06-23
申请号:CN202010587169.7
申请日:2020-06-24
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06F16/36 , G06F40/35
Abstract: 本说明书的实施例公开了一种模拟用户发言的方法和系统,该方法包括:获取待模拟对话,基于所述待模拟对话确定待模拟客服对话策略。基于所述待模拟客服对话策略从对话字典中确定至少一条目标用户发言;所述对话字典基于历史对话中任意轮对话生成,所述对话字典包括历史客服对话策略和历史用户发言之间的映射关系;在所述对话字典中所述目标用户发言对应的历史客服对话策略与所述待模拟客服对话策略匹配。将所述至少一条目标用户发言作为所述待模拟对话的用户发言的模拟结果。
-
公开(公告)号:CN111538906B
公开(公告)日:2023-06-20
申请号:CN202010477510.3
申请日:2020-05-29
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/9535 , G06F21/62 , G06F40/30 , G06N3/0464
Abstract: 本说明书实施例提供一种基于隐私保护的信息推送方法和装置,可以用于在保护用户隐私数据的前提下,基于历史会话中的对象选择序列建立异构图,并根据异构图体现出的推送对象之间的深层关联关系,从多个候选推送对象中确定若干个目标对象进行信息推送。根据一个实施方式,可以获取当前会话中的对象选择序列,并添加目标项构成预测序列,接着,将预测序列中的各项基于异构图确定描述向量,再根据各个描述向量推测目标项的预测向量,之后根据预测向量和各个候选推送对象的描述向量的对比,为目标项确定多个目标对象。该实施方式可以提高信息推送的准确度。
-
公开(公告)号:CN110750977B
公开(公告)日:2023-06-02
申请号:CN201911009970.7
申请日:2019-10-23
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/205 , G06F16/33 , G06F18/22 , G06N3/04
Abstract: 本说明书实施例公开了一种文本相似度计算方法及系统。所述方法包括:获取第一文本和第二文本;所述第一文本和所述第二文本存在第一编辑距离,所述第一编辑距离小于预设第一编辑距离阈值;根据所述第一文本和所述第二文本之间的差异,提取第一差异文本和第二差异文本;至少根据所述第一文本和所述第二文本提取对应的第一特征向量;至少根据所述第一差异文本和所述第二差异文本提取对应的第二特征向量;基于所述第一特征向量和所述第二特征向量,获得第三特征向量;并基于所述第三特征向量,确定所述第一文本和所述第二文本之间的相似度。
-
公开(公告)号:CN111401042B
公开(公告)日:2023-04-14
申请号:CN202010223432.4
申请日:2020-03-26
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/216 , G06F40/30 , G06F40/126
Abstract: 本说明书实施例公开了一种训练文本关键内容提取模型的方法和系统。所述方法包括:获取若干个训练样本,所述训练样本包括问题和拼接文档,所述拼接文档包括对应于所述问题的关键内容、干扰内容以及与所述关键内容和干扰内容对应的分隔符;基于所述问题和所述拼接文档,利用机器阅读模型处理得到对应的表示向量;利用所述表示向量训练初始模型得到文本关键内容提取模型,其中,所述文本关键内容提取模型的输出为所述拼接文档中与每一内容对应的分隔符的预测值;基于所述预测值,构建损失函数,迭代优化所述文本关键内容提取模型。本说明书采用用户的反馈数据构造训练样本,可以有效提升机器阅读模型的质量和难度。
-
公开(公告)号:CN111459917B
公开(公告)日:2023-02-28
申请号:CN202010302438.0
申请日:2020-04-17
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/21 , G06F16/23 , G06F16/332
Abstract: 本说明书提供一种知识库管理方法、装置及处理设备,可以针对群聊服务场景,对于群聊用户多,角色不清晰的聊天内容进行对话响应关系的确定,再基于对话响应关系进行问答信息的挖掘,确定出候选问答信息。利用人工客服对候选问答信息的点击采纳实现对候选问答信息进行反馈验证,将采纳率大于预设阈值的候选问答信息添加知识库中,可以不需要运营人员参与,实现了知识库的自动更新以及零运营管理。
-
公开(公告)号:CN110717028B
公开(公告)日:2022-02-15
申请号:CN201910995960.9
申请日:2019-10-18
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06F16/33 , G06F16/335 , G06N3/04
Abstract: 本说明书实施例公开了一种剔除干扰问题对的方法及系统。所述方法包括:获取至少一个问题对,将所述至少一个问题对输入初始剔除模型,剔除所述至少一个问题对中的干扰问题对;所述干扰问题对是指与目标主题不相关的问题对;将所述至少一个问题对中未剔除的第一问题对输入匹配模型,确定所述第一问题对的第一匹配结果;基于所述第一匹配结果以及所述第一问题对标定的第二匹配结果,得到反馈值;根据所述反馈值调整所述初始剔除模型,得到目标剔除模型,采用所述目标剔除模型剔除目标问题对中的干扰问题对。
-
-
-
-
-
-
-
-
-