-
公开(公告)号:CN114896983A
公开(公告)日:2022-08-12
申请号:CN202210513283.4
申请日:2022-05-12
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/30 , G06F40/295 , G06N20/00 , G06N3/04 , G06N3/08
Abstract: 本说明书实施例公开了一种模型训练方法、文本处理方法、装置和计算机设备。所述模型训练方法包括:获取原始文本、正样本和负样本,正样本和负样本为原始文本的改写文本;通过编码器,确定原始文本对应的第一分布参数、正样本对应的第二分布参数和负样本对应的第三分布参数,第一分布参数用于限定第一语义分布,第二分布参数用于限定第二语义分布,第三分布参数用于限定第三语义分布;根据第一分布参数、第二分布参数和第三分布参数,通过损失函数优化编码器的模型参数,所述损失函数包括第一项,所述第一项用于约束第一语义分布与第二语义分布之间的相似程度大于第一语义分布与第三语义分布之间的相似程度。本说明书实施例可以提高模型训练效果。
-
公开(公告)号:CN111538825A
公开(公告)日:2020-08-14
申请号:CN202010632352.4
申请日:2020-07-03
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06F16/31 , G06F16/35 , G06F16/36 , G06F40/30
Abstract: 本说明书实施例公开了一种知识问答方法、装置、系统、设备及存储介质,包括:获取用户问句;对用户问句和预先构建的结构化数据中结构部分进行编码得到第一特征向量,从结构化数据上召回与用户问句相关的候选子图,并对候选子图进行编码得到第二特征向量;根据第一特征向量和第二特征向量进行针对用户问句的多任务分类,根据分类结果得到用户问句的答案内容。
-