-
公开(公告)号:CN111340218B
公开(公告)日:2022-04-15
申请号:CN202010113810.3
申请日:2020-02-24
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例公开了一种训练问题识别模型的方法和系统,所述方法包括:获取多个第一文本和多个第二文本,所述第一文本和所述第二文本分别为问题类文本和非问题类文本;生成模型基于所述第一文本与所述第二文本之间的相似度,为所述第一文本选择满足第一预设条件的至少一个所述第二文本,生成至少一个文本对;将所述文本对输入初始问题识别模型进行训练,训练得到目标问题识别模型。
-
公开(公告)号:CN111475637B
公开(公告)日:2020-10-09
申请号:CN202010588724.8
申请日:2020-06-24
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06N5/02
Abstract: 本说明书实施例提供一种用于推送知识点的数据处理、训练方法及装置,基于异构图提取符合预设格式的多组元路径,获取异构图中各个节点的对应的第一特征,然后将多组元路径输入预先训练得到的图神经网络模型,通过图神经网络模型对元路径上节点的第一特征进行聚合,至少输出作为路径端点的用户节点和/或知识点节点对应的第二特征,第二特征用于对用户节点和知识点节点进行匹配,以向用户推送相应知识点。该方案能够更精确地匹配用户需求。
-
公开(公告)号:CN111552787A
公开(公告)日:2020-08-18
申请号:CN202010328553.5
申请日:2020-04-23
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06F16/33 , G06F16/35 , G06F40/289 , G06F40/35 , G06N3/04 , G06N3/08
Abstract: 本说明书实施例公开了一种问答处理方法、装置、设备及存储介质,获取用户问题匹配的候选对话记录集,针对候选对话记录集中每段对话记录,以用户问题替换对话记录的代表问题,得到待分类的文本对象,并通过文本分类模型对文本对象进行分类,得到表征用户问题与对话记录之间的匹配程度文本对象的文本分类结果,根据每个文本对象的文本分类结果,从候选对话记录集选出目标对话记录,并将目标对话记录提供给当前提问用户。
-
公开(公告)号:CN111324722B
公开(公告)日:2020-08-14
申请号:CN202010409812.7
申请日:2020-05-15
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06F16/33
Abstract: 本说明书实施例提供一种训练词语权重模型的方法和系统。所述方法包括:获取多个文本对;判断所述文本对中两个文本之间是否匹配,得到匹配结果;基于所述匹配结果确定所述文本对中文本的词语的重要性标识,得到含有所述重要性标识的多个文本对;基于多个训练数据训练词语权重模型,所述训练数据来源于含有所述重要性标识的多个文本对中的文本。
-
公开(公告)号:CN111310848A
公开(公告)日:2020-06-19
申请号:CN202010131419.6
申请日:2020-02-28
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种多任务模型的训练方法及装置,在训练方法中,获取训练样本集,该训练样本集中的每个样本包括由一个问题和多个历史会话对组成的输入文本、第一标签和第二标签。对于任意的第一训练样本,将其中的输入文本输入文本编码层,得到输入文本的文本向量。从文本向量中确定出多个答案中各答案的语义向量。将各答案的语义向量输入问答相关性分类层,通过输出得到第一预测结果。基于第一预测结果和第一标签,确定第一预测损失。将文本向量输入答案选择层,通过输出得到第二预测结果。基于第二预测结果和第二标签,确定第二预测损失。基于训练样本集中各样本的第一预测损失与第二预测损失的融合结果,调整多任务模型的参数。
-
公开(公告)号:CN111274787A
公开(公告)日:2020-06-12
申请号:CN202010108943.1
申请日:2020-02-21
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/205 , G06F40/279
Abstract: 本说明书的实施例公开了一种用户意图预测方法和系统。该方法包括:获取与用户相关的一个或多个因子信息;所述因子信息至少反映用户在某服务平台内的操作行为;基于所述因子信息确定多个候选意图文本;基于语言模型处理所述多个候选意图文本以及所述因子信息,得到多个相关度;多个相关度分别反映所述多个候选意图文本与所述因子信息的相关性;以及,至少基于所述多个相关度从所述多个候选意图文本中确定目标意图文本。
-
公开(公告)号:CN110955755A
公开(公告)日:2020-04-03
申请号:CN201911210000.3
申请日:2019-11-29
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/33 , G06F16/332 , G06N3/04 , G06N20/00
Abstract: 本说明书一个或多个实施例涉及一种确定目标标准信息的方法及系统。所述确定目标标准信息的方法包括:获取用户问题及其对应的一个或多个候选标准信息;基于所述用户问题和所述一个或多个候选标准信息确定候选文本信息;至少基于机器学习模型和所述候选文本信息,从所述一个或多个候选标准信息中确定目标标准信息。
-
公开(公告)号:CN110909885A
公开(公告)日:2020-03-24
申请号:CN201911139061.5
申请日:2019-11-19
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书一个或多个实施例公开了一种平衡多个任务的方法。所述方法包括:获取第一任务的第一损失函数和至少一个第二任务的第二损失函数,所述第一损失函数对应主任务,所述至少一个第二损失函数对应至少一个辅任务;根据所述第一损失函数得到第一损失函数对应的第一损失函数值;根据所述第二损失函数得到第二损失函数对应的第二损失函数值;根据所述第一损失函数值和所述至少一个第二损失函数值之间的大小关系,确定至少一个平衡参数;所述至少一个平衡参数用于将所述至少一个第二损失函数和所述第一损失函数调整至同一量级;使用所述至少一个平衡参数,确定第一损失函数和至少一个第二损失函数对应的联合损失函数。
-
公开(公告)号:CN110765247A
公开(公告)日:2020-02-07
申请号:CN201910940923.8
申请日:2019-09-30
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06F16/35 , G06F16/9535
Abstract: 本说明书提供一种用于问答机器人的输入提示方法及装置,所述方法包括:对问答机器人接收到的提问输入信息进行分词、归一化预处理,基于预处理后的信息在知识点数据库中选择搜索候选提示信息,并以文本相似度和候选提问信息的频次信息即流量占比作为衡量指标,筛选出目标提示信息,将目标提示信息推荐给用户。
-
公开(公告)号:CN110750977A
公开(公告)日:2020-02-04
申请号:CN201911009970.7
申请日:2019-10-23
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/205 , G06F16/33 , G06K9/62 , G06N3/04
Abstract: 本说明书实施例公开了一种文本相似度计算方法及系统。所述方法包括:获取第一文本和第二文本;所述第一文本和所述第二文本存在第一编辑距离,所述第一编辑距离小于预设第一编辑距离阈值;根据所述第一文本和所述第二文本之间的差异,提取第一差异文本和第二差异文本;至少根据所述第一文本和所述第二文本提取对应的第一特征向量;至少根据所述第一差异文本和所述第二差异文本提取对应的第二特征向量;基于所述第一特征向量和所述第二特征向量,获得第三特征向量;并基于所述第三特征向量,确定所述第一文本和所述第二文本之间的相似度。
-
-
-
-
-
-
-
-
-