-
公开(公告)号:CN111444319A
公开(公告)日:2020-07-24
申请号:CN202010533381.5
申请日:2020-06-12
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/33 , G06F16/35 , G06F40/216 , G06F40/194 , G06F40/126 , G06F40/284 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本说明书提出了一种文本匹配方法、装置和电子设备,其中,上述方法包括:获取待匹配文本,根据所述待匹配文本得到知识点集合;根据所述知识点集合中的每个知识点进行查询,得到与每个所述知识点对应的一个或多个扩展信息;依次将每个所述知识点对应的扩展信息与所述待匹配文本进行计算,得到相似度集合;根据所述相似度集合与所述知识点集合确定与所述待匹配文本匹配的知识点。通过上述方法可以提高输入文本与知识点之间的匹配的准确度。
-
公开(公告)号:CN111401076A
公开(公告)日:2020-07-10
申请号:CN202010272706.9
申请日:2020-04-09
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/30 , G06F40/289 , G06N3/04
Abstract: 本说明书一个或多个实施例提供一种文本的相似度确定方法、装置和电子设备;所述方法包括:获取第一文本和第二文本;根据所述第一文本和第二文本,得到对应于所述第一文本和所述第二文本的文本表示向量;根据所述第一文本和第二文本,确定共有单字表示向量和差异单字表示向量;其中,所述共有单字表示向量对应于在所述第一文本和所述第二文本中均存在的单字,所述差异单字表示向量对应于仅在所述第一文本和所述第二文本之一中存在的单字;根据所述文本表示向量、所述共有单字表示向量和所述差异单字表示向量,得到对应于所述第一文本和所述第二文本的文本特征向量;根据所述文本特征向量,确定所述第一文本和所述第二文本的相似度。
-
公开(公告)号:CN111400484A
公开(公告)日:2020-07-10
申请号:CN202010200961.2
申请日:2020-03-20
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/335 , G06F40/289 , G06F40/284 , G06F40/205 , G06K9/62
Abstract: 本说明书实施例公开了一种关键词提取方法和系统,所述方法包括:获取目标文本;从所述目标文本中选择目标词语;将所述目标文本的信息以及当前选择的目标词语的位置信息输入关键词提取模型,得到该目标词语的去除或保留操作;执行该目标词语的去除或保留操作,得到操作后的目标文本;判断所述操作后的目标文本中是否存在未被执行所述操作的词语;若是,则以所述操作后的目标文本替换所述目标文本,从所述操作后的目标文本中选择其中一个所述未被执行所述操作的词语,以该词语作为所述当前选择的目标词语,重复执行上述输入关键词提取模型至判断的步骤;若否,则将所述操作后的目标文本中的词语确定为所述目标文本的关键词。
-
公开(公告)号:CN111340245A
公开(公告)日:2020-06-26
申请号:CN202010118876.1
申请日:2020-02-26
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N20/10
Abstract: 本说明书实施例公开了一种模型训练方法及系统,所述方法包括,获取经过训练数据训练的k个同类型的子模型,所述k为大于或等于2的整数,所述训练数据包括图像数据、文本数据或音频数据;获取所述k个子模型中每个子模型的与模型性能相关的评价参数;基于所述k个子模型及其评价参数,确定最终模型,所述最终模型的模型参数为:所述k个子模型的模型参数以其评价参数为权重的加权运算结果。
-
公开(公告)号:CN111309878A
公开(公告)日:2020-06-19
申请号:CN202010059894.7
申请日:2020-01-19
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06F16/33
Abstract: 本说明书提供一种检索式问答方法,包括:对接收的第一文本进行分词,得到至少一个第一词语;确定所述至少一个第一词语的词权重;根据所述至少一个第一词语从知识库召回至少一个候选问题-答案对;针对每个候选问题-答案对,分别将候选问题-答案对中的问题作为第二文本,确定所述第二文本包含的至少一个第二词语及其词权重;根据所述至少一个第一词语、所述至少一个第二词语及其词权重确定第一文本和候选问题-答案对中每个问题的匹配度;根据确定的匹配度返回至少一个候选问题-答案对中的答案。本说明书还提供了实现了检索式问答的服务器、电子设备以及计算机可读存储介质。
-
公开(公告)号:CN110738059A
公开(公告)日:2020-01-31
申请号:CN201911000110.7
申请日:2019-10-21
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/30
Abstract: 本说明书实施例公开了一种文本相似度计算的方法及系统。所述方法包括:获取第一文本,并提取与所述第一文本相对应的至少一个第一特征;根据所述第一文本得到与所述第一文本相关的多个第二文本;其中,与所述多个第二文本中的至少一个第二文本对应的至少一个第二特征已经存储在特征数据库中;将所述第一特征以及所述特征数据库中存储的第二特征输入交互模型,使用所述交互模型计算所述第一文本与所述第二本文本的相似度。
-
公开(公告)号:CN110727767A
公开(公告)日:2020-01-24
申请号:CN201911000025.0
申请日:2019-10-21
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/33
Abstract: 本说明书实施例公开了一种扩展文本样本的方法及系统。所述方法包括:将第一文本在文本库中检索,获取与所述第一文本的相似度在设定区间的多个第二文本;基于所述第一文本和所述多个第二文本中的每一个在知识库中检索,确定所述第一文本的第一检索结果和所述第二文本的第二检索结果;所述知识库至少包含与所述第一文本关联的多个文本;判断所述第一检索结果和所述第二检索结果之间的关系是否满足预设条件;将满足所述预设条件的所述第二文本确定为所述第一文本的扩展文本。
-
公开(公告)号:CN111274808B
公开(公告)日:2023-07-04
申请号:CN202010086368.X
申请日:2020-02-11
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/289 , G06F40/216 , G06F40/30 , G06F16/35
Abstract: 本说明书涉及一种文本检索方法包括:对接收的第一文本进行分词,得到至少一个词语;根据所述至少一个词语从知识库中召回至少一个第二文本;将所述至少一个词语输入经过训练的文本向量模型,得到所述第一文本的文本向量;根据所述第一文本的向量从所述知识库中召回至少一个第三文本;以及将所述至少一个第二文本和所述至少一个第三文本进行融合,得到文本检索结果。本说明书还提供了词权重模型和文本向量模型的训练方法、文本检索装置、电子设备以及计算机可读存储介质。
-
公开(公告)号:CN111274787B
公开(公告)日:2023-04-18
申请号:CN202010108943.1
申请日:2020-02-21
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/205 , G06F40/279
Abstract: 本说明书的实施例公开了一种用户意图预测方法和系统。该方法包括:获取与用户相关的一个或多个因子信息;所述因子信息至少反映用户在某服务平台内的操作行为;基于所述因子信息确定多个候选意图文本;基于语言模型处理所述多个候选意图文本以及所述因子信息,得到多个相关度;多个相关度分别反映所述多个候选意图文本与所述因子信息的相关性;以及,至少基于所述多个相关度从所述多个候选意图文本中确定目标意图文本。
-
公开(公告)号:CN110909885B
公开(公告)日:2022-09-23
申请号:CN201911139061.5
申请日:2019-11-19
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书一个或多个实施例公开了一种平衡多个任务的方法。所述方法包括:获取第一任务的第一损失函数和至少一个第二任务的第二损失函数,所述第一损失函数对应主任务,所述至少一个第二损失函数对应至少一个辅任务;根据所述第一损失函数得到第一损失函数对应的第一损失函数值;根据所述第二损失函数得到第二损失函数对应的第二损失函数值;根据所述第一损失函数值和所述至少一个第二损失函数值之间的大小关系,确定至少一个平衡参数;所述至少一个平衡参数用于将所述至少一个第二损失函数和所述第一损失函数调整至同一量级;使用所述至少一个平衡参数,确定第一损失函数和至少一个第二损失函数对应的联合损失函数。
-
-
-
-
-
-
-
-
-