-
公开(公告)号:CN117312492A
公开(公告)日:2023-12-29
申请号:CN202311141896.0
申请日:2023-09-05
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/33 , G06F18/214 , G06N3/0442
Abstract: 本说明书实施例公开了一种数据的检索方法、装置及设备,该方法包括:获取目标事件的查询请求,查询请求中包括目标事件的事件文本,获取针对查询请求的历史事件文书集,对事件文本进行关键信息提取,得到事件文本对应的事件信息,事件信息包括目标事件的事件触发词,对事件信息和事件文本进行编码处理,得到第一编码信息,并对第一编码信息中事件触发词对应的编码信息进行池化处理,得到第二编码信息,对历史事件文书进行编码处理,得到第三编码信息集,基于预先训练的表征模型对第二编码信息和第三编码信息集进行处理,并基于处理后的第二编码信息和第三编码信息集,从历史事件文书集中确定查询到的与目标事件相匹配的历史事件文书。
-
公开(公告)号:CN116757208A
公开(公告)日:2023-09-15
申请号:CN202310466681.X
申请日:2023-04-26
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/295 , G06F40/279 , G06F16/35 , G06F18/214 , G06F18/2415 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本说明书实施例提供了多种数据处理方法、装置及设备,其中一种方法包括:获取用于训练第一模型的文本数据样本及文本数据样本包含的词对应的实体类型标签,基于第一损失函数、文本数据样本及文本数据样本包含的词对应的实体类型标签,对第一模型进行迭代训练,并在第一模型满足预设收敛条件的情况下,基于由初步训练的第一模型对文本数据样本进行实体识别处理得到的文本数据样本包含的词对应不同的预测实体类型的概率分布,确定的初步训练的第一模型对应的预测熵,对第一损失函数中的参数进行更新处理,并基于更新后的第一损失函数对初步训练的第一模型进行迭代训练,直到第一模型收敛,得到训练后的第一模型。
-
公开(公告)号:CN116541509A
公开(公告)日:2023-08-04
申请号:CN202310507025.X
申请日:2023-05-04
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/335 , G06F16/35 , G06F18/22 , G06F18/213 , G06N3/045 , G06N3/0455
Abstract: 本说明书实施例提供了多种数据处理方法、装置及设备,其中一种方法包括:接收针对目标文本数据的相似文本检索请求,响应于相似文本检索请求,获取由基于训练后的目标模型得到的目标文本数据包含的语句对应的第一特征向量、目标文本数据包含的语句对应的预测类别、候选文本数据包含的语句对应的第二特征向量,以及候选文本数据包含的语句对应的预测类别,确定的目标文本数据和候选文本数据之间的目标相似度,基于目标相似度,从候选文本数据中筛选出与目标文本数据存在匹配关系的候选文本数据,并将筛选出的候选文本数据确定为针对目标文本数据的相似文本检索结果。
-
公开(公告)号:CN116522939A
公开(公告)日:2023-08-01
申请号:CN202310466522.X
申请日:2023-04-26
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/295 , G06F16/35 , G06F40/30 , G06F18/214 , G06F18/24
Abstract: 本说明书实施例提供了多种数据处理方法、装置及设备,其中一种方法包括:通过目标模型对文本数据样本进行实体识别处理,得到文本数据样本包含的词对应的预测实体类型,基于词对应的预测实体类型和实体类型标签,将文本数据样本包含的词划分为第一样本和包含噪声的第二样本,并基于第一样本对应的预测实体类型和实体类型标签,确定第一损失值,对增强处理得到的第二样本进行语义提取处理,得到第二样本对应的语义向量,基于由第二样本对应的语义向量构建的正样本对和负样本对,确定第二损失值,基于第一损失值和第二损失值,确定目标模型对应的目标损失值,并基于目标损失值对目标模型进行迭代训练,直至目标模型收敛,得到训练后的目标模型。
-
-
-