-
公开(公告)号:CN116541509A
公开(公告)日:2023-08-04
申请号:CN202310507025.X
申请日:2023-05-04
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/335 , G06F16/35 , G06F18/22 , G06F18/213 , G06N3/045 , G06N3/0455
Abstract: 本说明书实施例提供了多种数据处理方法、装置及设备,其中一种方法包括:接收针对目标文本数据的相似文本检索请求,响应于相似文本检索请求,获取由基于训练后的目标模型得到的目标文本数据包含的语句对应的第一特征向量、目标文本数据包含的语句对应的预测类别、候选文本数据包含的语句对应的第二特征向量,以及候选文本数据包含的语句对应的预测类别,确定的目标文本数据和候选文本数据之间的目标相似度,基于目标相似度,从候选文本数据中筛选出与目标文本数据存在匹配关系的候选文本数据,并将筛选出的候选文本数据确定为针对目标文本数据的相似文本检索结果。
-
公开(公告)号:CN114861666A
公开(公告)日:2022-08-05
申请号:CN202210468468.8
申请日:2022-04-29
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/295 , G06F40/186 , G06K9/62 , G06N20/00
Abstract: 本说明书实施例提供了实体分类模型的训练方法、装置及计算机可读存储介质。方法包括以下步骤。获取第一样本集,其中包括第一训练样本,第一训练样本包括第一原始文本及其对应的第一模板文本,第一模板文本用于描述第一原始文本中的第一实体和第一实体对应的多个第一实体类型;将第一原始文本输入第一实体分类模型,得到第一预测结果,其中包括顺次输出第一模板文本中各个字的第一概率得分;根据第一预测结果,确定第一训练样本对应的第一预测损失;基于第一样本集中各训练样本对应的预测损失,训练第一实体分类模型,使得实体分类模型学习原始文本的信息以实现实体的多标签分类。
-