-
公开(公告)号:CN111552787B
公开(公告)日:2023-06-30
申请号:CN202010328553.5
申请日:2020-04-23
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06F16/33 , G06F16/35 , G06F40/289 , G06F40/35 , G06N3/0442 , G06N3/0464 , G06N3/08
Abstract: 本说明书实施例公开了一种问答处理方法、装置、设备及存储介质,获取用户问题匹配的候选对话记录集,针对候选对话记录集中每段对话记录,以用户问题替换对话记录的代表问题,得到待分类的文本对象,并通过文本分类模型对文本对象进行分类,得到表征用户问题与对话记录之间的匹配程度文本对象的文本分类结果,根据每个文本对象的文本分类结果,从候选对话记录集选出目标对话记录,并将目标对话记录提供给当前提问用户。
-
公开(公告)号:CN111538906B
公开(公告)日:2023-06-20
申请号:CN202010477510.3
申请日:2020-05-29
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/9535 , G06F21/62 , G06F40/30 , G06N3/0464
Abstract: 本说明书实施例提供一种基于隐私保护的信息推送方法和装置,可以用于在保护用户隐私数据的前提下,基于历史会话中的对象选择序列建立异构图,并根据异构图体现出的推送对象之间的深层关联关系,从多个候选推送对象中确定若干个目标对象进行信息推送。根据一个实施方式,可以获取当前会话中的对象选择序列,并添加目标项构成预测序列,接着,将预测序列中的各项基于异构图确定描述向量,再根据各个描述向量推测目标项的预测向量,之后根据预测向量和各个候选推送对象的描述向量的对比,为目标项确定多个目标对象。该实施方式可以提高信息推送的准确度。
-
公开(公告)号:CN110750977B
公开(公告)日:2023-06-02
申请号:CN201911009970.7
申请日:2019-10-23
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/205 , G06F16/33 , G06F18/22 , G06N3/04
Abstract: 本说明书实施例公开了一种文本相似度计算方法及系统。所述方法包括:获取第一文本和第二文本;所述第一文本和所述第二文本存在第一编辑距离,所述第一编辑距离小于预设第一编辑距离阈值;根据所述第一文本和所述第二文本之间的差异,提取第一差异文本和第二差异文本;至少根据所述第一文本和所述第二文本提取对应的第一特征向量;至少根据所述第一差异文本和所述第二差异文本提取对应的第二特征向量;基于所述第一特征向量和所述第二特征向量,获得第三特征向量;并基于所述第三特征向量,确定所述第一文本和所述第二文本之间的相似度。
-
公开(公告)号:CN111401042B
公开(公告)日:2023-04-14
申请号:CN202010223432.4
申请日:2020-03-26
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/216 , G06F40/30 , G06F40/126
Abstract: 本说明书实施例公开了一种训练文本关键内容提取模型的方法和系统。所述方法包括:获取若干个训练样本,所述训练样本包括问题和拼接文档,所述拼接文档包括对应于所述问题的关键内容、干扰内容以及与所述关键内容和干扰内容对应的分隔符;基于所述问题和所述拼接文档,利用机器阅读模型处理得到对应的表示向量;利用所述表示向量训练初始模型得到文本关键内容提取模型,其中,所述文本关键内容提取模型的输出为所述拼接文档中与每一内容对应的分隔符的预测值;基于所述预测值,构建损失函数,迭代优化所述文本关键内容提取模型。本说明书采用用户的反馈数据构造训练样本,可以有效提升机器阅读模型的质量和难度。
-
公开(公告)号:CN110765247B
公开(公告)日:2022-10-25
申请号:CN201910940923.8
申请日:2019-09-30
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06F16/35 , G06F16/9535
Abstract: 本说明书提供一种用于问答机器人的输入提示方法及装置,所述方法包括:对问答机器人接收到的提问输入信息进行分词、归一化预处理,基于预处理后的信息在知识点数据库中选择搜索候选提示信息,并以文本相似度和候选提问信息的频次信息即流量占比作为衡量指标,筛选出目标提示信息,将目标提示信息推荐给用户。
-
公开(公告)号:CN110717028B
公开(公告)日:2022-02-15
申请号:CN201910995960.9
申请日:2019-10-18
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06F16/33 , G06F16/335 , G06N3/04
Abstract: 本说明书实施例公开了一种剔除干扰问题对的方法及系统。所述方法包括:获取至少一个问题对,将所述至少一个问题对输入初始剔除模型,剔除所述至少一个问题对中的干扰问题对;所述干扰问题对是指与目标主题不相关的问题对;将所述至少一个问题对中未剔除的第一问题对输入匹配模型,确定所述第一问题对的第一匹配结果;基于所述第一匹配结果以及所述第一问题对标定的第二匹配结果,得到反馈值;根据所述反馈值调整所述初始剔除模型,得到目标剔除模型,采用所述目标剔除模型剔除目标问题对中的干扰问题对。
-
公开(公告)号:CN111444319B
公开(公告)日:2020-10-20
申请号:CN202010533381.5
申请日:2020-06-12
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/33 , G06F16/35 , G06F40/216 , G06F40/194 , G06F40/126 , G06F40/284 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本说明书提出了一种文本匹配方法、装置和电子设备,其中,上述方法包括:获取待匹配文本,根据所述待匹配文本得到知识点集合;根据所述知识点集合中的每个知识点进行查询,得到与每个所述知识点对应的一个或多个扩展信息;依次将每个所述知识点对应的扩展信息与所述待匹配文本进行计算,得到相似度集合;根据所述相似度集合与所述知识点集合确定与所述待匹配文本匹配的知识点。通过上述方法可以提高输入文本与知识点之间的匹配的准确度。
-
公开(公告)号:CN111522957A
公开(公告)日:2020-08-11
申请号:CN202010384233.1
申请日:2020-05-09
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/35 , G06F40/126 , G06F40/205 , G06F40/237 , G06F40/289
Abstract: 本说明书的实施例公开了一种短语分割模型的训练方法和系统,所述方法包括:基于公共知识库获取至少一个目标短语,目标短语包含至少两个词;基于目标短语从公共知识库中获取至少一个第一文本,第一文本包含目标短语;基于第一文本获取非目标短语,非目标短语为第一文本的一部分,且不同于目标短语;将目标短语和第一文本构成的文本对作为正样本,非目标样本和第一文本构成的文本对作为负样本;基于多组正样本和负样本训练得到短语分割模型。
-
公开(公告)号:CN111241412B
公开(公告)日:2020-08-07
申请号:CN202010329694.9
申请日:2020-04-24
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/9535 , G06F16/36
Abstract: 本说明书实施例公开了一种确定用于信息推荐的图谱的方法、系统、及装置。所述方法包括:获取构建目标图谱的多个节点;所述节点至少包括词语节点,以及知识点节点;若所述节点为词语节点,将该节点对应的词语的向量表示作为该节点的向量表示;若所述节点为知识点节点,基于与所述知识点节点相关的词语的向量表示,确定对应于所述知识点节点的向量表示;对于任意两个节点:基于所述两个节点的类型,确定所述两个节点之间的边权,并将所述边权作为所述两个节点之间的关联关系;基于节点的向量表示,以及节点与节点之间的关联关系,进行至少一轮图聚合迭代,以更新所述图谱中节点的向量表示。
-
公开(公告)号:CN111340218A
公开(公告)日:2020-06-26
申请号:CN202010113810.3
申请日:2020-02-24
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例公开了一种训练问题识别模型的方法和系统,所述方法包括:获取多个第一文本和多个第二文本,所述第一文本和所述第二文本分别为问题类文本和非问题类文本;生成模型基于所述第一文本与所述第二文本之间的相似度,为所述第一文本选择满足第一预设条件的至少一个所述第二文本,生成至少一个文本对;将所述文本对输入初始问题识别模型进行训练,训练得到目标问题识别模型。
-
-
-
-
-
-
-
-
-