确定查询文本所对应标准文本的方法及装置

    公开(公告)号:CN110990533B

    公开(公告)日:2023-08-25

    申请号:CN201911203536.2

    申请日:2019-11-29

    Inventor: 张望舒 温祖杰

    Abstract: 本说明书实施例提供一种确定查询文本所对应标准文本的方法。该方法包括:首先,获取用户输入的查询文本。然后,一方面,将所述查询文本输入基于Bert的第一语义模型中,得到查询语义向量;另一方面,获取若干候选文本,所述若干候选文本是根据所述查询文本检索标准文本库而确定;再获取所述若干候选文本对应的若干候选语义向量,所述若干候选语义向量通过基于Bert的第二语义模型而确定。接着,将查询语义向量分别与若干候选语义向量进行综合处理,得到若干综合向量;再然后,分别将所述若干综合向量输入预先训练的关联度预测模型,得到所述查询文本与所述若干候选文本之间的若干关联度,以用于从所述若干候选文本中确定所述查询文本所对应的标准文本。

    数据编码以及信息推荐方法、装置和设备

    公开(公告)号:CN111506822B

    公开(公告)日:2023-08-18

    申请号:CN202010471060.7

    申请日:2020-05-28

    Abstract: 本申请的提出数据编码以及信息推荐方法、装置和设备。该方法包括:将用于确定注意力权重的状态数据,输入第一神经网络,得到第一编码向量。将用户长期行为数据,以及该长期行为的发生时刻,与该长期行为的上一次长期行为的发生时刻之间的第一间隔时长数据,输入第二神经网络,得到第二编码向量。将用户短期行为数据,以及该短期行为的发生时刻,与该短期行为的上一次短期行为的发生时刻之间的第二间隔时长数据,输入第三神经网络,得到第三编码向量。根据上述第一编码向量,确定注意力权重向量。基于上述注意力权重向量,对上述第二编码向量与上述第三编码向量进行编码。

    强化学习模型的更新方法和装置

    公开(公告)号:CN110990548B

    公开(公告)日:2023-04-25

    申请号:CN201911206271.1

    申请日:2019-11-29

    Inventor: 张望舒 温祖杰

    Abstract: 本说明书实施例提供一种强化学习模型的更新方法和装置。强化学习模型包括第一动作价值网络和第二动作价值网络,分别承担第一比例和第二比例的线上流量,第一比例大于第二比例,方法包括:接收线上的当前问句;以当前问句作为当前状态,利用第一动作价值网络或利用第二动作价值网络得到当前状态对应的动作,以及相应的得到当前状态、动作、奖励和更新状态作为一条记录,将该条记录以一定概率存储;抽取记录,根据该记录对第二动作价值网络进行训练;当确定训练后的第二动作价值网络的效果优于第一动作价值网络时,将第一动作价值网络更新为训练后的第二动作价值网络。能够保证强化学习模型更新后的稳定性和质量。

    训练样本获取方法、装置及设备

    公开(公告)号:CN110688471B

    公开(公告)日:2022-09-09

    申请号:CN201910942797.X

    申请日:2019-09-30

    Abstract: 本说明书实施例提供一种训练样本获取方法、装置及设备,在获取方法中,收集两批已标注样本,包括第一批样本和第二批样本。第一批样本中的样本包括第一用户问句和第一标签,第一标签通过人工的方式标注。第二批样本中的样本包括第二用户问句和第二标签,第二标签通过自动的方式标注。基于第一批样本,训练样本分类模型。对于第二批样本,将第二用户问句输入样本分类模型,以得到第二用户问句对应于预定义的各个类别的预测概率。基于第二用户问句对应于预定义的各个类别的预测概率以及第二标签,确定预测结果与真实结果之间的差异度。当差异度大于第一阈值时,对第一样本进行编辑。基于编辑后的第二批样本和所述第一批样本,确定最终的训练样本。

    计算机执行的机器学习模型的训练方法、装置及设备

    公开(公告)号:CN110705717B

    公开(公告)日:2022-05-17

    申请号:CN201910942795.0

    申请日:2019-09-30

    Inventor: 张望舒 温祖杰

    Abstract: 本说明书实施例提供一种计算机执行的机器学习模型的训练方法、装置及设备,在训练方法中,获取在当前时间段内的增量数据,作为训练样本集。基于训练样本集,对在上一时间段训练后的机器学习模型进行增量训练,得到初始机器学习模型。将测试样本集中的各测试样本输入初始机器学习模型,以得到测试结果。基于测试结果,确定初始机器学习模型的准确率。若准确率大于第一阈值,则将初始机器学习模型作为在当前时间段训练后的机器学习模型。若准确率不大于第一阈值,则将测试样本集中测试结果错误的测试样本加入训练样本集,得到更新后的训练样本集,并基于更新后的训练样本集,对初始机器学习模型进行训练,以得到在当前时间段训练后的机器学习模型。

    神经网络模型的融合训练方法及装置

    公开(公告)号:CN111291886B

    公开(公告)日:2022-02-18

    申请号:CN202010131424.7

    申请日:2020-02-28

    Abstract: 本说明书实施例提供一种神经网络模型的融合训练方法及装置。通过神经网络模型的模型训练过程包括若干训练周期,每个训练周期对应于使用训练样本集中所有样本数据进行模型训练的过程,神经网络模型用于对输入的业务数据进行业务预测。在当前的第一训练周期中,当第一训练周期不是第一个训练周期时,基于第一训练周期之前的训练周期训练结束时得到的神经网络模型对第一样本数据的预测数据的累积,而得到的第一目标预测数据,即根据第一目标预测数据对待训练神经网络模型的训练过程进行调整,更新待训练神经网络模型。

    查询文档排序方法、装置及电子设备

    公开(公告)号:CN112395405B

    公开(公告)日:2021-04-27

    申请号:CN202011602065.5

    申请日:2020-12-30

    Inventor: 张望舒 温祖杰

    Abstract: 本说明书一个或多个实施例提供一种查询文档排序方法、装置及电子设备,包括:基于训练样本集对作为老师模型的第一排序模型进行有监督的训练;其中,训练样本包括查询问句和与查询问句对应的查询文档,并被标注了指示查询文档与查询问句是否匹配的标签;第一排序模型包括对至少一个评分子模型进行模型融合得到的排序模型;评分子模型用于输出查询文档对应于查询问句的匹配度评分;基于第一排序模型输出的与训练样本集对应的排序结果对作为学生模型的第二排序模型进行预训练,并基于训练样本集对预训练后的第二排序模型进行模型微调;其中,第一排序模型和第二排序模型用于按照匹配度评分对与同一查询问句对应的多个查询文档进行排序。

    一种训练方法、文本生成方法、装置及电子设备

    公开(公告)号:CN111738437B

    公开(公告)日:2020-11-20

    申请号:CN202010689980.6

    申请日:2020-07-17

    Inventor: 梁忠平 温祖杰

    Abstract: 本说明书一个或多个实施例提供一种训练方法、文本生成方法、装置及电子设备;训练过程采用Teacher‑Student的训练构架,以教师生成模型和学生生成模型联合训练的方式实现。教师生成模型为一般的文本生成模型,其用于供学生生成模型学习其文本生成方法;学生生成模型则引入用于控制输出文本的最大长度的第一长度控制向量,以及用于控制输出文本的最小长度的第二长度控制向量,通过第一长度控制向量和第二长度控制向量来训练学生生成模型控制输出文本长度的能力;基于强化学习方法,通过回报值来得到教师生成模型和学生生成模型的联合损失并训练学生生成模型以得到输出文本长度可控的生成模型,用于生成本长度可控的输出文本。

    一种确定文本标签的方法和系统

    公开(公告)号:CN111324738B

    公开(公告)日:2020-08-28

    申请号:CN202010409780.0

    申请日:2020-05-15

    Abstract: 本说明书的实施例公开了一种确定文本标签的方法和系统,所述方法包括:获取文本,所述文本对应至少一个候选标签;基于文本和至少一个候选标签中的一个组成文本标签对;将文本标签对输入判断模型,所述判断模型包含至少一个交互模型,判断模型基于交互模型输出的文本标签对中候选标签的交互编码,确定候选标签是否为文本的真实标签;其中,所述交互模型包含第一编码模型,所述第一编码模型基于第一多头注意力机制,得到候选标签的交互编码;其中:文本的编码作为第一多头注意力机制中计算K和V的输入,候选标签的编码作为第一多头注意力机制中计算Q的输入。

Patent Agency Ranking