-
公开(公告)号:CN118364047A
公开(公告)日:2024-07-19
申请号:CN202410386476.7
申请日:2024-04-01
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/33 , G06F16/332 , G06F16/35 , G06F40/295 , G06F40/30 , G06F40/284 , G06V30/19 , G06V10/82 , G06N3/09 , G06N3/045
Abstract: 本说明书实施例公开了一种实体关系提取模型训练、实体关系提取方法、装置及设备。实体可以是身份性的个人信息。获取多个文本样本及其样本标签;其中,每个文本样本包括按序排列的若干文本单元,每个文本样本的样本标签表示该文本样本中每个文本单元是否实际属于实体,以及文本单元所属的实体之间是否实际存在预定义的关联关系;以每个文本样本为模型输入,以每个文本样本的关系提取结果为模型输出,根据每个文本样本的样本标签训练所述实体关系提取模型。
-
公开(公告)号:CN116188895A
公开(公告)日:2023-05-30
申请号:CN202211679253.7
申请日:2022-12-26
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V10/774 , G06V10/40
Abstract: 本说明书提供一种模型训练的方法、装置、存储介质及电子设备,通过设置不同的训练任务,包括小程序页面的还原、预测小程序的服务类型以及小程序页面的元素类型等,使小程序识别模型不仅具备文本和图像的识别能力,还具有对小程序页面布局方式的理解能力,提升了模型的训练效果。本说明书还提供了识别小程序的方法,使用通过上述模型训练的方法训练完成的小程序识别模型对小程序进行识别,根据小程序的页面对应的图像提取到小程序的特征,利用该特征对小程序实现精准识别,提高了识别小程序的效率。
-
公开(公告)号:CN115345174A
公开(公告)日:2022-11-15
申请号:CN202210993894.3
申请日:2022-08-18
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例公开了一种地址信息的匹配方法、装置及设备,该方法包括:获取目标模型,基于预设的训练策略和预设的训练策略对应的第一样本数据对目标模型进行模型训练,得到训练后的第一模型,预设的训练策略包括虚假地址识别的子策略、地址中预设地理区域预测的子策略和地址距离预测的子策略中的一种或多种;基于预设的模型结构调整策略和预设的模型结构调整策略对应的第二样本数据对第一模型进行模型训练,得到训练后的第二模型,第二模型用于对地址信息的语义进行匹配的模型;基于第二模型对获取的两个地址信息的语义进行匹配处理,以确定两个地址信息是否相同,得到两个地址信息的匹配结果。
-
公开(公告)号:CN113722610A
公开(公告)日:2021-11-30
申请号:CN202110929595.9
申请日:2021-08-13
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/9536 , G06F16/9538 , G06Q50/00
Abstract: 本说明书实施例公开了基于搜索场景的用户间互动方法、装置以及设备。方案包括:确定第一用户对应的公域内的热搜数据;根据热搜数据,在第一用户的搜索界面中展示热搜榜单;获取第二用户针对第一用户定制的情感信息;根据情感信息,确定对应的情感搜索条目;在热搜榜单中展示情感搜索条目,以便第一用户根据情感搜索条目获得情感信息。
-
公开(公告)号:CN118312682A
公开(公告)日:2024-07-09
申请号:CN202410451694.4
申请日:2021-08-13
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/9536 , G06F16/9538 , G06Q50/00
Abstract: 本说明书实施例公开了用户间互动方法、装置以及设备。方案包括:获取第二用户针对第一用户定制的情感信息;判断是否获取到所述第二用户的风险信息,所述风险信息是根据所述第二用户针对所述第一用户以外的用户定制的情感信息确定的,所述风险信息是服务器或者所述第一用户对应终端确定的;若是,则为所述第一用户展示所述风险信息。
-
公开(公告)号:CN113722610B
公开(公告)日:2024-03-19
申请号:CN202110929595.9
申请日:2021-08-13
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/9536 , G06F16/9538 , G06Q50/00
Abstract: 本说明书实施例公开了基于搜索场景的用户间互动方法、装置以及设备。方案包括:确定第一用户对应的公域内的热搜数据;根据热搜数据,在第一用户的搜索界面中展示热搜榜单;获取第二用户针对第一用户定制的情感信息;根据情感信息,确定对应的情感搜索条目;在热搜榜单中展示情感搜索条目,以便第一用户根据情感搜索条目获得情感信息。
-
公开(公告)号:CN114821616A
公开(公告)日:2022-07-29
申请号:CN202210454967.1
申请日:2022-04-24
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V30/413 , G06V30/24 , G06V30/19
Abstract: 本说明书实施例提供了页面表征模型训练的方法、装置及计算设备。该方法包括:获取与目标页面相关的多个对象对应的多个编码向量;多个对象包括位于目标页面中的多个第一文字;利用训练好的目标检测模型,检测目标页面中的版面元素各自对应的标定元素类别得到第一结果;将多个编码向量输入页面表征模型,页面表征模型基于注意力机制对多个编码向量进行处理,得到对应的多个表征向量;根据多个表征向量,确定第二结果,第二结果包括多个对象的部分或全部的预测元素类别;根据第一结果和第二结果确定第一预测损失;根据第一预测损失对页面表征模型进行训练,使得页面表征模型学习页面的版面元素和页面的文字之间的关系,更好的表征页面的文字信息。
-
公开(公告)号:CN114821616B
公开(公告)日:2024-10-11
申请号:CN202210454967.1
申请日:2022-04-24
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V30/413 , G06V30/24 , G06V30/19
Abstract: 本说明书实施例提供了页面表征模型训练的方法、装置及计算设备。该方法包括:获取与目标页面相关的多个对象对应的多个编码向量;多个对象包括位于目标页面中的多个第一文字;利用训练好的目标检测模型,检测目标页面中的版面元素各自对应的标定元素类别得到第一结果;将多个编码向量输入页面表征模型,页面表征模型基于注意力机制对多个编码向量进行处理,得到对应的多个表征向量;根据多个表征向量,确定第二结果,第二结果包括多个对象的部分或全部的预测元素类别;根据第一结果和第二结果确定第一预测损失;根据第一预测损失对页面表征模型进行训练,使得页面表征模型学习页面的版面元素和页面的文字之间的关系,更好的表征页面的文字信息。
-
公开(公告)号:CN118377841A
公开(公告)日:2024-07-23
申请号:CN202410390218.6
申请日:2024-04-01
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/33 , G06F16/332 , G06F16/35 , G06F40/295 , G06F40/30 , G06F40/284 , G06V30/19 , G06V10/82 , G06N3/09 , G06N3/045
Abstract: 本说明书实施例公开了一种实体信息提取模型训练、实体信息提取方法、装置及设备。实体可以是身份性的个人信息。获取多个文本样本及其样本标签;其中,每个文本样本包括按序排列的若干文本单元,每个文本样本的样本标签表示该文本样本实际包含的实体信息;以每个文本样本为模型输入,以每个文本样本的信息提取结果为模型输出,根据每个文本样本的样本标签训练所述实体信息提取模型。
-
公开(公告)号:CN117786107A
公开(公告)日:2024-03-29
申请号:CN202311754776.8
申请日:2023-12-18
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/35 , G06F18/214 , G06F18/241 , G06N3/045 , G06N3/096
Abstract: 本说明书公开了一种文本分类模型的训练方法、装置、介质及电子设备,所述方法包括:确定文本样本和以及确定预先训练的若干教师模型。再按照各教师模型的参数量从小到大的顺序,依次针对每个教师模型,将文本样本输入该教师模型,确定伪标结果,以及将文本样本输入待训练的学生模型,确定分类结果,至少根据基于该教师模型得到的伪标结果以及分类结果,对待训练的学生模型进行训练。之后,将训练完成的学生模型作为文本分类模型。通过各教师指导学生模型训练,提高文本分类模型的文本表征能力和分类准确率。
-
-
-
-
-
-
-
-
-