-
公开(公告)号:CN111046156B
公开(公告)日:2023-10-13
申请号:CN201911199043.6
申请日:2019-11-29
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06N20/00
Abstract: 本说明书提供了奖励数据的确定方法、装置和服务器。在一个实施例中,奖励数据的确定方法通过先获取第一样本用户针对当前标签的点击状态数据,以及预设的提问模型根据第一样本用户针对当前标签的点击状态数据所确定出的当前动作策略数据;再通过调用事先训练好的预设的奖励模型根据所述第一样本用户针对当前标签的点击状态数据,以及当前动作策略数据,确定出反馈给预设的提问模型的用于强化学习的奖励数据。从而能够快速、准确地获取用于强化学习的奖励数据。
-
公开(公告)号:CN111538831A
公开(公告)日:2020-08-14
申请号:CN202010502724.1
申请日:2020-06-05
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/34 , G06F16/332 , G06F40/205 , G06F40/289 , G06N3/04 , G06N3/08
Abstract: 本说明书一个或多个实施例提供一种文本生成方法、装置及电子设备;本说明书一个或多个实施例的方案,设计构建文本生成模型,该文本生成模型包括编码器和解码器,基于编码器-解码器的结构,由编码器对输入文本进行编码,并基于自注意力机制相应生成输入文本包括的各个词的自注意力特征来确定输出词来自输入文本的概率,还结合编码器在当前步生成的自注意力特征以及解码器在前一步生成的自注意力特征,来确定输出词来自词典的概率以及前一步的输出词对于当前步输出词的输出概率的影响,进而由解码器逐步输出输出词以最终得到输出文本。
-
公开(公告)号:CN111104591A
公开(公告)日:2020-05-05
申请号:CN201911199008.4
申请日:2019-11-29
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/9535
Abstract: 本说明书提供一种推荐信息生成方法及装置,所述方法包括:将信息推荐时,单轮一次生成多个推荐信息,转换为单轮多次生成多个推荐信息,每一次生成一个推荐信息,并且上一次生成的推荐信息与信息推荐关联因子一起作为下一次推荐信息生成的输入信息。通过将单轮一次生成多个推荐信息,转换为单轮多次生成多个推荐信息的方式,使得可以在每一次推荐信息的生成过程中,加入历史推荐信息。
-
-