模型训练方法、文本处理方法、装置和计算机设备

    公开(公告)号:CN114896983A

    公开(公告)日:2022-08-12

    申请号:CN202210513283.4

    申请日:2022-05-12

    Abstract: 本说明书实施例公开了一种模型训练方法、文本处理方法、装置和计算机设备。所述模型训练方法包括:获取原始文本、正样本和负样本,正样本和负样本为原始文本的改写文本;通过编码器,确定原始文本对应的第一分布参数、正样本对应的第二分布参数和负样本对应的第三分布参数,第一分布参数用于限定第一语义分布,第二分布参数用于限定第二语义分布,第三分布参数用于限定第三语义分布;根据第一分布参数、第二分布参数和第三分布参数,通过损失函数优化编码器的模型参数,所述损失函数包括第一项,所述第一项用于约束第一语义分布与第二语义分布之间的相似程度大于第一语义分布与第三语义分布之间的相似程度。本说明书实施例可以提高模型训练效果。

Patent Agency Ranking