文本分析模型的训练方法、文本分析方法及装置

    公开(公告)号:CN118626853A

    公开(公告)日:2024-09-10

    申请号:CN202410763384.6

    申请日:2024-06-13

    Abstract: 本说明书一个或多个实施例公开了一种文本分析模型的训练方法、文本分析方法及装置。文本分析模型的训练方法包括:获取第一样本数据集合和第二样本数据集合,第一样本数据集合包括第一样本文本和第一标签信息,第二样本数据集合包括第二样本文本和第二标签信息。在编码器的参数固定的情况下,将第一样本数据集合输入基座模型,对第一样本文本进行文本分析,得到第一分析结果。然后,根据第一分析结果和第一标签信息对待训练的适配器的参数进行调整,得到训练后的适配器。在训练后的适配器的参数固定的情况下,将第二样本数据集合输入基座模型,对第二样本文本进行文本分析,得到第二分析结果。之后,根据第二分析结果和第二标签信息对编码器的参数进行调整,得到目标文本分析模型。

    用于多任务多场景推荐的推荐模型的训练方法和推荐方法

    公开(公告)号:CN117010992A

    公开(公告)日:2023-11-07

    申请号:CN202310959867.9

    申请日:2023-08-01

    Abstract: 本说明书实施例公开了一种用于多任务多场景推荐的推荐模型的训练方法和推荐方法,涉及信息推荐模块,本说明书通过提供的推荐模型包括多个任务中各任务对应的场景网络,在向用户进行推荐时确定目标推荐内容对应的至少一个目标任务和目标场景,通过推荐模型包括的目标任务对应的场景网络中场景共有网络和目标场景专有网络,生成目标推荐内容。针对该推荐模型的训练,基于包括已标注的推荐内容的样本集合,首先对推荐模型包括的全部场景网络进行第一参数训练,其次对各任务对应的多个场景专有网络进行第二参数训练,最后对各任务对应的多个场景专有网络进行第三参数训练,直至推荐模型拟合,且第二参数训练和第三参数训练的训练方法不相同。

    一种模型的元学习方法、装置以及设备

    公开(公告)号:CN115861681A

    公开(公告)日:2023-03-28

    申请号:CN202211422452.X

    申请日:2022-11-14

    Abstract: 本说明书实施例公开了一种模型的元学习方法、装置以及设备。方案包括通过获取包含M个样本的集合;针对第i个样本Si,生成对应于所述训练样本的嵌入向量φi和中间特征图ηi;根据所产生的M个嵌入向量的平均值τc生成维度注意力图Md,和,根据所产生的M个中间特征图的平均值τη生成区域注意力图Mr;融合所述嵌入向量φi和维度注意力图Md生成维度特征向量φi’,以及,融合所述第i个样本的中间特征图ηi和所述区域注意力图Mr生成区域特征图ηi’;根据所述维度特征向量φi’和所述区域特征图ηi’进行训练。从而实现在元学习中,通过从维度和区域这两个不同的角度上来精确定位任务所需要的特征,减少无关特征的干扰。

    通过强化学习模型对业务预测模型进行压缩的方法和装置

    公开(公告)号:CN111340227A

    公开(公告)日:2020-06-26

    申请号:CN202010409973.6

    申请日:2020-05-15

    Abstract: 本说明书实施例提供一种通过强化学习模型对业务模型进行压缩的方法和装置。方法包括,首先获取通过神经网络实现的业务模型,其包含N个网络层。依次将各个网络层作为当前层进行剪枝操作,该操作包括,基于当前层的层特征确定环境状态,将环境状态输入强化学习模型,得到针对当前层的剪枝决策,据此进行剪枝;并在样本队列中添加当前层的剪枝记录,该记录包括环境状态和剪枝决策。然后,将验证数据集输入N个网络层均进行剪枝后的压缩模型,得到性能评估结果。根据该性能评估结果确定奖励分数,将奖励分数分别添加到N条剪枝记录中,形成N条训练样本。然后,根据样本队列中的训练样本,更新强化学习模型。

    大语言模型微调方法、样本特征补全方法及装置

    公开(公告)号:CN118395955A

    公开(公告)日:2024-07-26

    申请号:CN202410481673.7

    申请日:2024-04-19

    Abstract: 本说明书实施例提供了一种大语言模型微调方法、样本特征补全方法及装置。将任意一个样本包含的若干特征及其特征值转换成语言文本,该样本包含的某个特征的特征值用于作为待预测特征的标签数据,并且从语言文本中去除该特征的特征值;接着,利用该语言文本和该特征生成提示模板,对大语言模型进行微调。在对大语言模型进行微调后,利用大语言模型基于该语言文本对该特征的特征值进行预测,基于预测值对样本的缺失特征值进行补全。样本特征包含隐私数据,使用大语言模型对样本的缺失特征进行补全时,需要进行隐私保护。

    推荐模型的训练方法及装置
    6.
    发明公开

    公开(公告)号:CN116596093A

    公开(公告)日:2023-08-15

    申请号:CN202310623027.5

    申请日:2023-05-29

    Abstract: 本说明书实施例提供了推荐模型的训练方法及装置,推荐模型的训练方法包括:获取混合场景样本集,混合场景样本集包括多个推荐项的特征数据,且该多个推荐项的特征数据对应于多个不同的场景;根据混合场景样本集,对初始推荐模型进行模型训练,得到中间推荐模型;初始推荐模型包括多目标单元和预设目标集合中每个推荐目标对应的多场景单元;多目标单元包括多个专家子单元、每个推荐目标对应的门控子单元以及每个推荐目标对应的归一化子单元;获取多个单场景样本集;根据每个单场景样本集,分别对中间推荐模型进行模型训练,得到推荐模型;推荐模型用于确定推荐项,该推荐项在预设场景中满足由预设场景和每个推荐目标确定的多目标推荐条件。

    组合特征评估模型的样本生成和训练方法及装置

    公开(公告)号:CN111291895B

    公开(公告)日:2022-06-28

    申请号:CN202010054042.9

    申请日:2020-01-17

    Abstract: 本说明书实施例提供一种组合特征评估模型的样本生成和训练方法及装置。在样本生成阶段,从第一样本包括M1维特征中选取待组合的多个特征维度,对于多个特征维度中的各个特征维度,根据N1个第一样本在该特征维度下的特征值分布,确定该特征维度的第一元特征;基于第一组合规则对N1个第一样本在多个特征维度下的特征值进行组合,得到第一组合特征;基于第一组合特征的特征值分布和N1个第一样本的第一标注数据,确定第一组合特征对提升业务预测模型预测效果的第一价值,并基于第一价值生成第二标注数据,通过多个特征维度各自的第一元特征、第一组合规则和第二标注数据,确定第二样本。在模型训练阶段,使用第二样本对组合特征评估模型进行训练。

    组合特征评估模型的样本生成和训练方法及装置

    公开(公告)号:CN111291895A

    公开(公告)日:2020-06-16

    申请号:CN202010054042.9

    申请日:2020-01-17

    Abstract: 本说明书实施例提供一种组合特征评估模型的样本生成和训练方法及装置。在样本生成阶段,从第一样本包括M1维特征中选取待组合的多个特征维度,对于多个特征维度中的各个特征维度,根据N1个第一样本在该特征维度下的特征值分布,确定该特征维度的第一元特征;基于第一组合规则对N1个第一样本在多个特征维度下的特征值进行组合,得到第一组合特征;基于第一组合特征的特征值分布和N1个第一样本的第一标注数据,确定第一组合特征对提升业务预测模型预测效果的第一价值,并基于第一价值生成第二标注数据,通过多个特征维度各自的第一元特征、第一组合规则和第二标注数据,确定第二样本。在模型训练阶段,使用第二样本对组合特征评估模型进行训练。

Patent Agency Ranking