-
公开(公告)号:CN111401076A
公开(公告)日:2020-07-10
申请号:CN202010272706.9
申请日:2020-04-09
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/30 , G06F40/289 , G06N3/04
Abstract: 本说明书一个或多个实施例提供一种文本的相似度确定方法、装置和电子设备;所述方法包括:获取第一文本和第二文本;根据所述第一文本和第二文本,得到对应于所述第一文本和所述第二文本的文本表示向量;根据所述第一文本和第二文本,确定共有单字表示向量和差异单字表示向量;其中,所述共有单字表示向量对应于在所述第一文本和所述第二文本中均存在的单字,所述差异单字表示向量对应于仅在所述第一文本和所述第二文本之一中存在的单字;根据所述文本表示向量、所述共有单字表示向量和所述差异单字表示向量,得到对应于所述第一文本和所述第二文本的文本特征向量;根据所述文本特征向量,确定所述第一文本和所述第二文本的相似度。
-
公开(公告)号:CN111400413A
公开(公告)日:2020-07-10
申请号:CN202010162561.7
申请日:2020-03-10
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例公开了确定知识库中知识点类目的方法及系统,所述方法包括:获取至少一个待预测知识点,并确定与至少一个待预测知识点分别对应的知识库;判断对应的知识库的类目确定方式;其中,类目确定方式包括分类模型确定、距离匹配确定以及规则匹配确定方式中的至少两个;当类目确定方式为分类模型确定时,将待预测知识点输入基于对应的知识库训练的分类模型,确定待预测知识点的类目;当类目确定方式为距离匹配确定时,基于待预测知识点与对应的知识库中每个类目的知识点之间的距离关系,确定待预测知识点的类目;当类目确定方式为规则匹配确定时,基于预设规则确定待预测知识点的类目。
-
公开(公告)号:CN111368059A
公开(公告)日:2020-07-03
申请号:CN202010461146.1
申请日:2020-05-27
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06F16/33 , G06F16/35 , G06F16/335 , H04L12/58
Abstract: 本说明书提供的群聊机器人自主应答的方法和系统,在接收到所述目标通讯群中的目标用户发送的输入语句后,基于输入语句和预设的知识库生成一个与输入语句相关的候选列表,并将所述候选列表发送给目标客户端或包括目标客户端在内的第一组客户端,以降低对其他用户的影响;在第一组客户端的管理客户端对候选列表做出选择后,再将与选择匹配的目标答案发送给第二组客户端。所述方法不仅可以主动对用户提出的问题进行回答,同时又不会对群聊中的其他用户造成干扰,在提升工作效率的同时,又可以提升用户体验。
-
公开(公告)号:CN111340245A
公开(公告)日:2020-06-26
申请号:CN202010118876.1
申请日:2020-02-26
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N20/10
Abstract: 本说明书实施例公开了一种模型训练方法及系统,所述方法包括,获取经过训练数据训练的k个同类型的子模型,所述k为大于或等于2的整数,所述训练数据包括图像数据、文本数据或音频数据;获取所述k个子模型中每个子模型的与模型性能相关的评价参数;基于所述k个子模型及其评价参数,确定最终模型,所述最终模型的模型参数为:所述k个子模型的模型参数以其评价参数为权重的加权运算结果。
-
公开(公告)号:CN111339283A
公开(公告)日:2020-06-26
申请号:CN202010410440.X
申请日:2020-05-15
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06F16/33 , G06F40/284 , G06Q40/08
Abstract: 本说明书实施例提供一种针对用户问题提供客服答案的方法,根据一个实施方式,在获取用户的当前问题后,可以基于当前问题,从知识库中获取多个历史对话记录中的第一对话记录,然后利用预先训练的预测模型,处理当前问题和第一对话记录的拼接文本,得到第一处理结果,接着根据第一处理结果,确定当前问题对应于第一对话记录的第一候选答案,并基于第一候选答案,针对当前问题提供客服答案。其中,用于机器阅读的预测模型,在机器阅读任务中,充分考虑客服场景下对话记录的文本具有交互性的特点,融入轮次特征和/或角色特征,提升机器阅读的性能。
-
公开(公告)号:CN111339256A
公开(公告)日:2020-06-26
申请号:CN202010127184.3
申请日:2020-02-28
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/33 , G06F16/332 , G06F40/211 , G06N3/04 , G06N3/08
Abstract: 本说明书的实施例提供了用于文本处理的方法、装置、计算设备和机器可读存储介质。该方法包括:接收第一文本向量和第二文本向量,其中,第一文本向量用于表示用户问句文本,第二文本向量用于表示候选问句文本,候选问句文本是从知识库中获取的;利用RNN和CNN,对第一文本向量和第二文本向量进行编码,得到针对第一文本向量的第一编码结果和针对第二文本向量的第二编码结果;基于第一编码结果和第二编码结果,确定用户问句文本与候选问句文本之间的相似度,其中,相似度用于确定针对用户问句文本的答复。
-
公开(公告)号:CN111309889A
公开(公告)日:2020-06-19
申请号:CN202010123765.X
申请日:2020-02-27
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06F16/36 , G06Q30/00
Abstract: 本说明书的实施例提供了用于文本处理的方法、装置、计算设备和机器可读存储介质。该方法包括:从目标机器对话日志中获取目标问题文本,目标问题文本用于表示机器人客服未能回答的用户问题;基于目标问题文本,获取目标人工对话日志,目标人工对话日志是基于目标问题文本而产生的;利用机器阅读模型对目标问题文本和目标人工对话日志进行处理,其中机器阅读模型是通过基于训练语料对预训练语言模型进行训练而得到的,训练语料是基于历史问题文本和历史人工对话日志得到的;基于机器阅读模型的处理结果,从目标人工对话日志中获取针对目标问题文本的答案文本,其中,目标问题文本和答案文本以问答对的形式被存储到知识库中。
-
公开(公告)号:CN111309878A
公开(公告)日:2020-06-19
申请号:CN202010059894.7
申请日:2020-01-19
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06F16/33
Abstract: 本说明书提供一种检索式问答方法,包括:对接收的第一文本进行分词,得到至少一个第一词语;确定所述至少一个第一词语的词权重;根据所述至少一个第一词语从知识库召回至少一个候选问题-答案对;针对每个候选问题-答案对,分别将候选问题-答案对中的问题作为第二文本,确定所述第二文本包含的至少一个第二词语及其词权重;根据所述至少一个第一词语、所述至少一个第二词语及其词权重确定第一文本和候选问题-答案对中每个问题的匹配度;根据确定的匹配度返回至少一个候选问题-答案对中的答案。本说明书还提供了实现了检索式问答的服务器、电子设备以及计算机可读存储介质。
-
公开(公告)号:CN111259130A
公开(公告)日:2020-06-09
申请号:CN202010092082.2
申请日:2020-02-14
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06F40/211 , G06F40/289 , G06N20/00
Abstract: 本公开提供了用于在对话中提供答复语句的方法及装置,在该方法中,获取包括用户的当前对话语句和上下文对话语句的查询语句,以及从对话日志中搜索出的回答语料,并对查询语句和回答语料分别进行向量化处理以得到查询语句向量矩阵和回答语料向量矩阵,将查询语句向量和回答语料向量提供给机器阅读理解模型,以从回答语料中确定当前对话语句的答复语句的起始词语位置和结束词语位置,基于所确定的起始词语位置和结束词语位置,从回答语料中获取答复语句。
-
公开(公告)号:CN110765249A
公开(公告)日:2020-02-07
申请号:CN201911000228.X
申请日:2019-10-21
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332
Abstract: 本说明书实施例提供一种机器人客服引导对话中多轮对话的质检方法和装置,方法包括:获取机器人客服与目标用户之间的当前多轮对话的第一对话文本;将所述第一对话文本输入预先训练的回归模型,通过所述回归模型输出所述当前多轮对话的对话得分,所述回归模型基于训练样本而训练,所述训练样本基于用户和人工客服的历史对话而生成,所述对话得分用于指示所述第一对话文本中包括的正常对话的对话轮数;当所述第一对话文本包括的对话轮数与所述正常对话的对话轮数的差值大于预设阈值时,确认所述当前多轮对话为异常对话。能够高效地实现机器人客服引导对话中多轮对话的质检。
-
-
-
-
-
-
-
-
-