-
公开(公告)号:CN110765253A
公开(公告)日:2020-02-07
申请号:CN201911008117.3
申请日:2019-10-22
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06F16/33 , G06F40/205 , G06Q30/00 , G06Q30/06
Abstract: 本说明书实施例提供一种客服场景下用户问句的回复方法、装置及设备,在回复方法中,接收第一租户下的当前用户问句。针对当前用户问句,获取当前用户问句的上下文信息。基于第一租户的租户标识、当前用户问句和上下文信息,生成新用户问句。基于新用户问句,从与第一租户对应的知识库中召回预定数目个答案。将预定数目个答案中的各答案以及新用户问句输入预测模型,以预测各答案与新用户问句的匹配分数。该预测模型包括多个租户共享的底层网络部分和多个租户分别对应的多个上层网络部分,多个上层网络部分具有相同的网络结构,以及针对不同租户训练得到的不同网络参数。基于匹配分数,从各答案中确定出目标答案并返回。
-
公开(公告)号:CN111582500A
公开(公告)日:2020-08-25
申请号:CN202010375851.X
申请日:2020-05-07
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N20/00
Abstract: 本说明书实施例公开了一种提高模型训练效果的方法和系统,包括:获取多个训练样本,训练样本包括训练样本数据和样本标签;将训练样本输入学生模型和至少一个老师模型,分别得到第一处理结果和至少一个第二处理结果;老师模型来自老师模型集合;动态确定至少一个老师模型中每一个对训练样本的重要性,并基于重要性对至少一个第二处理结果进行计算,确定融合处理结果;基于第一处理结果、样本标签和融合处理结果确定学生模型的第一损失函数;基于第一损失函数对学生模型的参数进行更新,并将参数更新后的学生模型加入老师模型集合作为一个新的老师模型;迭代多次完成学生模型的训练;学生模型训练后用于处理语音、图像或者文本数据。
-
公开(公告)号:CN111291886A
公开(公告)日:2020-06-16
申请号:CN202010131424.7
申请日:2020-02-28
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N3/08
Abstract: 本说明书实施例提供一种神经网络模型的融合训练方法及装置。通过神经网络模型的模型训练过程包括若干训练周期,每个训练周期对应于使用训练样本集中所有样本数据进行模型训练的过程,神经网络模型用于对输入的业务数据进行业务预测。在当前的第一训练周期中,当第一训练周期不是第一个训练周期时,基于第一训练周期之前的训练周期训练结束时得到的神经网络模型对第一样本数据的预测数据的累积,而得到的第一目标预测数据,即根据第一目标预测数据对待训练神经网络模型的训练过程进行调整,更新待训练神经网络模型。
-
公开(公告)号:CN111241280A
公开(公告)日:2020-06-05
申请号:CN202010015197.1
申请日:2020-01-07
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/35
Abstract: 本说明书实施例提供一种文本分类模型的训练方法和文本分类方法。在一个实施例中,一种文本分类模型的训练方法,包括:获取训练样本集;将训练样本集中文本样本分别输入公有特征提取器和与文本样本关联的私有特征提取器,得到文本样本的第一特征和第二特征;将文本样本的第一特征和第二特征分别输入任务判别器,得到文本样本的第一任务判别结果和第二任务判别结果;基于文本样本的第一特征和第二特征,利用与文本样本关联的私有特征提取器对应的分类器,得到文本样本的分类结果;判断是否满足预设训练停止条件;若不满足,调整文本分类模型的参数,并继续训练调整后的文本分类模型,直至满足预设训练停止条件,得到训练后的文本分类模型。
-
公开(公告)号:CN111191722A
公开(公告)日:2020-05-22
申请号:CN201911395996.X
申请日:2019-12-30
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种通过计算机训练预测模型的方法和装置,可以将较前周期状态下的预测模型,作为较后周期的预测模型的老师模型,仅需要老师模型的历史概率分布,和样本标签一起为模型参数的调整指引方向。由于每个训练周期中,各个状态下的输入样本都随机抽取,如果当前训练周期当前状态下输入的当前样本有多个,则这多个样本可以携带有历史训练周期中不同状态下的模型参数信息,相当于同时向多个老师模型学习,加快学习效率,提升模型学习效果。同时,存储的数据仅为各个样本在相关历史周期的概率分布,以较低的计算成本和存储成本,达到同时向多个老师模型学习的效果,可以提高模型训练的有效性。
-
公开(公告)号:CN111144567A
公开(公告)日:2020-05-12
申请号:CN201911415075.5
申请日:2019-12-31
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种神经网络模型的训练方法及装置。模型训练过程包括若干子训练过程,一个子训练过程包括预设数量个训练周期。在第N子训练过程的第M训练周期中,当第N子训练过程非首个子训练过程,且第M训练周期非首个训练周期时,基于第N-1子训练过程的最后一个训练周期训练结束时得到的第一目标模型,以及第N子训练过程中的第M-1训练周期训练结束时得到的第二目标模型,对待训练神经网络模型的训练过程进行调整,更新待训练神经网络模型。
-
公开(公告)号:CN111104516A
公开(公告)日:2020-05-05
申请号:CN202010084986.0
申请日:2020-02-10
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/35
Abstract: 本说明书一个或多个实施例提供一种文本分类方法、装置及电子设备,基于BERT模型,所述BERT模型包括:至少两个依次连接的编码器层;所述方法,包括:将待分类文本输入所述BERT模型;采集每个所述编码器层的输出,得到对应于所述待分类文本的至少两个特征表示信息;融合至少两个所述特征表示信息,得到融合后的特征表示信息;融合后的特征表示信息充分利用每一编码器层的输出,且准确反映了文本所蕴含的词法和语法信息;根据所述融合后的特征表示信息,确定所述待分类文本的类型。
-
公开(公告)号:CN110991613A
公开(公告)日:2020-04-10
申请号:CN201911202733.2
申请日:2019-11-29
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例公开了一种训练神经网络的方法及系统。所述方法包括:将训练数据输入N+K层神经网络,第N层神经网络输出第一概率分布,第N+K层神经网络输出第二概率分布;其中,N和K为大于0的整数;根据所述第一概率分布与所述训练数据的标签,确定第一反馈信号;根据所述第二概率分布与所述训练数据的标签,确定第二反馈信号;根据所述第一反馈信号调节1~N层神经网络的参数,以及根据所述第二反馈信号调节1~N+K层神经网络的参数,得到训练好的N层神经网络。
-
公开(公告)号:CN112016299B
公开(公告)日:2023-11-14
申请号:CN202010898079.X
申请日:2020-08-31
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/211 , G06F40/289 , G06F40/284 , G06N3/0464 , G06N3/0442
Abstract: 本说明书实施例了提供一种生成依存句法树的方法及装置。该方法包括:在嵌入层,对待分析句子中各个位置对应的各个字分别进行嵌入处理,得到所述各个字各自的特征向量;在字关系生成层,利用自注意力机制,基于第一字的特征向量和第二字的特征向量,确定第一字到第二字的字间依存度;第一字和第二字为所述待分析句子中两个不同位置的字;在词关系生成层,基于第一词中的字到第二词中的字的字间依存度,确定第一词到第二词的词间依存度,第一词和第二词为所述待分析句子所包含的多个词中的两个不同词;在输出层,基于所述多个词中各词相互的词间依存度,确定依存句法树。该方法可以减少集外词情况的发生,具有较高的新词容错能力。
-
公开(公告)号:CN111538822B
公开(公告)日:2023-05-09
申请号:CN202010330706.X
申请日:2020-04-24
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06Q30/01 , G06N20/00
Abstract: 本说明书实施例提供一种智能客户服务机器人训练数据的生成方法和系统。该方法包括获取若干个样本数据,所述样本数据包括若干个具有顺序的样本片段,所述样本片段来自智能客户服务机器人或用户;获取与所述样本数据相关的多个候选资料片段;在所述样本数据中获取第一片段,所述第一片段与所述候选资料片段相似度满足第一预设条件,且来自所述智能客户服务机器人;基于所述第一片段,在所述样本数据中获取第二片段,所述第二片段与所述第一片段关联度满足第二预设条件,且来自所述用户;基于所述第二片段和所述候选资料片段生成训练数据。
-
-
-
-
-
-
-
-
-