-
公开(公告)号:CN111159558B
公开(公告)日:2023-07-18
申请号:CN201911409205.4
申请日:2019-12-31
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/9535 , G06F16/958 , G06F16/635 , G06F16/638
Abstract: 本说明书一个或多个实施例提供一种推荐列表的生成方法、装置和电子设备;所述方法包括:获取用户的用户特征;根据所述用户特征和预先训练的强化学习模型,得到所述用户点击推荐列表中的列表项的预测结果;响应于所述用户对所述推荐列表中的列表项的点击操作,得到点击结果;根据所述预测结果和所述点击结果,确定对应于所述预测结果的奖励分数;确定基准奖励分数;根据所述基准奖励分数,采用策略梯度算法优化所述强化学习模型,优化后的所述强化学习模型用于生成对应于所述用户的推荐列表。
-
公开(公告)号:CN111382271B
公开(公告)日:2023-05-23
申请号:CN202010156375.2
申请日:2020-03-09
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/35 , G06N3/0464 , G06N3/08
Abstract: 本说明书实施例提供一种文本分类模型的训练方法,此方法包括:首先,获取N个原始文本和对应的N个文本类别标签,其中N为大于1的正整数;接着,对N个原始文本进行拼接,得到拼接文本;然后,分别对N个文本类别标签进行独热编码,得到N个类别标签向量;再接着,对N个类别标签向量进行平均处理,得到综合标签向量;再然后,将该拼接文本输入文本分类模型中,得到综合分类结果;再基于该综合分类结果和该综合标签向量,训练所述文本分类模型。此外,本说明书实施例还提供一种文本分类方法,此方法包括:获取待分类的目标文本,并对其复制得到N个目标文本,进行拼接后输入利用上述训练方法得到的文本分类模型中,得到目标文本的文本分类结果。
-
公开(公告)号:CN111538822B
公开(公告)日:2023-05-09
申请号:CN202010330706.X
申请日:2020-04-24
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06Q30/01 , G06N20/00
Abstract: 本说明书实施例提供一种智能客户服务机器人训练数据的生成方法和系统。该方法包括获取若干个样本数据,所述样本数据包括若干个具有顺序的样本片段,所述样本片段来自智能客户服务机器人或用户;获取与所述样本数据相关的多个候选资料片段;在所述样本数据中获取第一片段,所述第一片段与所述候选资料片段相似度满足第一预设条件,且来自所述智能客户服务机器人;基于所述第一片段,在所述样本数据中获取第二片段,所述第二片段与所述第一片段关联度满足第二预设条件,且来自所述用户;基于所述第二片段和所述候选资料片段生成训练数据。
-
公开(公告)号:CN115168402A
公开(公告)日:2022-10-11
申请号:CN202210800826.0
申请日:2022-07-08
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/2452 , G06F40/151 , G06N3/08 , G06N3/04
Abstract: 本说明书实施例提供一种训练序列生成模型的方法和装置。根据该方法,首先获取原始训练样本,其中包括:通过自然语言对目标数据表进行查询的第一语句,目标数据表的元数据,以及作为数据查询语言的第二语句。然后根据预设的概率,对训练样本施加预定的若干种加噪操作,其中任意一种加噪操作至少包括,对第一语句和第二语句之一进行修改,由此生成加噪样本,其中包括源语句,目标元数据和目标语句。于是,基于源语句和目标元数据形成输入序列,利用序列生成模型处理输入序列,得到输出序列;并根据输出序列和目标语句,更新上述序列生成模型。
-
公开(公告)号:CN110909146B
公开(公告)日:2022-09-09
申请号:CN201911203510.8
申请日:2019-11-29
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06F16/35
Abstract: 本说明书实施例提供一种用于推送反问标签的标签推送模型训练方法、装置及设备,在训练方法中,获取用户问句。将用户问句输入预先训练的分类模型,以得到用户问句对应于各标准问句的匹配概率。在标签推荐树中,从当前选中节点出发,基于各标准问句的匹配概率,采用蒙特卡洛树搜索算法,对标签推荐树进行N次模拟访问,以得到当前选中节点的子节点集合中各子节点的访问次数。基于各子节点的访问次数,选取目标子节点。将子节点集合对应的子标签集合作为第一状态,将目标子节点对应的句子标签作为第一动作,将第一状态和所述第一动作添加到训练样本序列中,该训练样本序列用于训练标签推送模型。标签推送模型用于根据用户问句向用
-
公开(公告)号:CN111340233B
公开(公告)日:2022-08-09
申请号:CN202010104680.7
申请日:2020-02-20
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种机器学习模型的训练方法,该方法包括:基于获取的原始样本集,对执行相同任务的多个预测模型进行多轮训练,得到多个训练后模型。其中任一轮训练具体包括:先对原始样本集进行采样,得到若干原始样本,其中包括任意的第一原始样本,此样本中包括第一样本特征和第一样本标签;接着将第一样本特征分别输入多个预测模型中,得到多个第一预测结果;然后至少基于多个第一预测结果和第一样本标签,确定出现频次最高的第一最高频结果;进一步地,在第一最高频结果唯一的情况下,利用该结果对所述第一样本标签进行修正,得到第一修正样本;再接着利用根据所述若干原始样本得到的若干修正样本,分别训练所述多个预测模型。
-
公开(公告)号:CN111191722B
公开(公告)日:2022-08-09
申请号:CN201911395996.X
申请日:2019-12-30
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种通过计算机训练预测模型的方法和装置,可以将较前周期状态下的预测模型,作为较后周期的预测模型的老师模型,仅需要老师模型的历史概率分布,和样本标签一起为模型参数的调整指引方向。由于每个训练周期中,各个状态下的输入样本都随机抽取,如果当前训练周期当前状态下输入的当前样本有多个,则这多个样本可以携带有历史训练周期中不同状态下的模型参数信息,相当于同时向多个老师模型学习,加快学习效率,提升模型学习效果。同时,存储的数据仅为各个样本在相关历史周期的概率分布,以较低的计算成本和存储成本,达到同时向多个老师模型学习的效果,可以提高模型训练的有效性。
-
公开(公告)号:CN110909145B
公开(公告)日:2022-08-09
申请号:CN201911203428.5
申请日:2019-11-29
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06F16/35 , G06F16/33
Abstract: 本说明书实施例提供一种针对多任务模型的训练方法,其中多任务模型包括语义编码层,针对搜索交互场景的搜索输出层以及针对问答交互场景的问答输出层,其中训练方法包括:首先,获取搜索交互场景和问答交互场景下采集的多个训练样本;然后,对于其中任意的第一样本,至少将其中的用户输入文本输入语义编码层,得到语义向量,并且,将语义向量分别输入搜索输出层和问答输出层;进一步地,根据第一样本所对应的采集场景,从对应场景的输出层获取预测结果,并结合第一样本中的样本标签,确定所述第一样本对应的预测损失;最后,基于多个训练样本各自对应的预测损失之和,调整所述多任务模型的参数。
-
公开(公告)号:CN111079574B
公开(公告)日:2022-08-02
申请号:CN201911202734.7
申请日:2019-11-29
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例公开了一种训练神经网络的方法及系统。所述方法包括:将训练数据输入N层神经网络,第K层神经网络输出第一概率分布,第N层神经网络输出第二概率分布;其中,N大于K,N和K为大于0的整数;根据所述第一概率分布与所述第二概率分布,确定第一反馈信号;根据所述第一反馈信号调节1~K层神经网络的参数,使得所述1~K层神经网络学习所述第N层神经网络输出的第二概率分布,得到训练好的K层神经网络。
-
公开(公告)号:CN110704599B
公开(公告)日:2022-05-17
申请号:CN201910942807.X
申请日:2019-09-30
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06F16/33
Abstract: 本说明书实施例提供一种为预测模型生成样本可以使用大量选择数据为预测模型生成训练样本,并且在样本生成过程中,通过使用标准样本训练的初始预测模型作为指引,减少选择数据中的噪声干扰,提高生成的训练样本的有效性。本说明书实施例还提供一种训练预测模型的方法和装置,将以上训练样本用于训练预测模型,大大扩充了样本数量,可以减少人工打标的工作量,还可以增强预测模型的抗噪能力,大大提高预测模型的准确度。
-
-
-
-
-
-
-
-
-