一种模型训练的方法、装置、存储介质及电子设备

    公开(公告)号:CN116188895A

    公开(公告)日:2023-05-30

    申请号:CN202211679253.7

    申请日:2022-12-26

    Inventor: 陈欢 郭亚 祝慧佳

    Abstract: 本说明书提供一种模型训练的方法、装置、存储介质及电子设备,通过设置不同的训练任务,包括小程序页面的还原、预测小程序的服务类型以及小程序页面的元素类型等,使小程序识别模型不仅具备文本和图像的识别能力,还具有对小程序页面布局方式的理解能力,提升了模型的训练效果。本说明书还提供了识别小程序的方法,使用通过上述模型训练的方法训练完成的小程序识别模型对小程序进行识别,根据小程序的页面对应的图像提取到小程序的特征,利用该特征对小程序实现精准识别,提高了识别小程序的效率。

    一种地址信息的匹配方法、装置及设备

    公开(公告)号:CN115345174A

    公开(公告)日:2022-11-15

    申请号:CN202210993894.3

    申请日:2022-08-18

    Abstract: 本说明书实施例公开了一种地址信息的匹配方法、装置及设备,该方法包括:获取目标模型,基于预设的训练策略和预设的训练策略对应的第一样本数据对目标模型进行模型训练,得到训练后的第一模型,预设的训练策略包括虚假地址识别的子策略、地址中预设地理区域预测的子策略和地址距离预测的子策略中的一种或多种;基于预设的模型结构调整策略和预设的模型结构调整策略对应的第二样本数据对第一模型进行模型训练,得到训练后的第二模型,第二模型用于对地址信息的语义进行匹配的模型;基于第二模型对获取的两个地址信息的语义进行匹配处理,以确定两个地址信息是否相同,得到两个地址信息的匹配结果。

    页面表征模型训练的方法、装置及计算设备

    公开(公告)号:CN114821616A

    公开(公告)日:2022-07-29

    申请号:CN202210454967.1

    申请日:2022-04-24

    Abstract: 本说明书实施例提供了页面表征模型训练的方法、装置及计算设备。该方法包括:获取与目标页面相关的多个对象对应的多个编码向量;多个对象包括位于目标页面中的多个第一文字;利用训练好的目标检测模型,检测目标页面中的版面元素各自对应的标定元素类别得到第一结果;将多个编码向量输入页面表征模型,页面表征模型基于注意力机制对多个编码向量进行处理,得到对应的多个表征向量;根据多个表征向量,确定第二结果,第二结果包括多个对象的部分或全部的预测元素类别;根据第一结果和第二结果确定第一预测损失;根据第一预测损失对页面表征模型进行训练,使得页面表征模型学习页面的版面元素和页面的文字之间的关系,更好的表征页面的文字信息。

    页面表征模型训练的方法、装置及计算设备

    公开(公告)号:CN114821616B

    公开(公告)日:2024-10-11

    申请号:CN202210454967.1

    申请日:2022-04-24

    Abstract: 本说明书实施例提供了页面表征模型训练的方法、装置及计算设备。该方法包括:获取与目标页面相关的多个对象对应的多个编码向量;多个对象包括位于目标页面中的多个第一文字;利用训练好的目标检测模型,检测目标页面中的版面元素各自对应的标定元素类别得到第一结果;将多个编码向量输入页面表征模型,页面表征模型基于注意力机制对多个编码向量进行处理,得到对应的多个表征向量;根据多个表征向量,确定第二结果,第二结果包括多个对象的部分或全部的预测元素类别;根据第一结果和第二结果确定第一预测损失;根据第一预测损失对页面表征模型进行训练,使得页面表征模型学习页面的版面元素和页面的文字之间的关系,更好的表征页面的文字信息。

    一种文本分类模型的训练方法、装置、介质及电子设备

    公开(公告)号:CN117786107A

    公开(公告)日:2024-03-29

    申请号:CN202311754776.8

    申请日:2023-12-18

    Abstract: 本说明书公开了一种文本分类模型的训练方法、装置、介质及电子设备,所述方法包括:确定文本样本和以及确定预先训练的若干教师模型。再按照各教师模型的参数量从小到大的顺序,依次针对每个教师模型,将文本样本输入该教师模型,确定伪标结果,以及将文本样本输入待训练的学生模型,确定分类结果,至少根据基于该教师模型得到的伪标结果以及分类结果,对待训练的学生模型进行训练。之后,将训练完成的学生模型作为文本分类模型。通过各教师指导学生模型训练,提高文本分类模型的文本表征能力和分类准确率。

Patent Agency Ranking