-
-
公开(公告)号:CN116166770A
公开(公告)日:2023-05-26
申请号:CN202211233682.1
申请日:2022-10-10
Applicant: 马上消费金融股份有限公司 , 南开大学
IPC: G06F16/33 , G06F16/35 , G06F40/279 , G06F18/214 , G06F18/241 , G06N3/04
Abstract: 本公开提供了一种实体链接模型的训练方法及装置、实体链接方法及装置,该方法包括:对链接训练样本和链接训练样本对应的链接训练样本信息进行特征提取,获得链接训练样本的第一特征向量;链接训练样本是训练实体链接模型采用的样本;链接训练样本信息是与链接训练样本关联的信息;对链接训练样本的第一特征向量进行编码,获得链接训练样本的编码;基于链接训练样本的编码,获得链接训练样本的预测类型;预测类型是预测到的类型信息;基于链接训练样本的预测类型和链接训练样本的第一标准类型信息调整实体链接模型的参数。根据本公开的实施例能够提高实体链接模型的泛化能力,以及减少过拟合的情况。
-
公开(公告)号:CN116151254A
公开(公告)日:2023-05-23
申请号:CN202211556169.6
申请日:2022-12-06
Applicant: 马上消费金融股份有限公司 , 南开大学
IPC: G06F40/295 , G06N3/0895 , G06N3/0499 , G06N3/0464 , G06N3/0442 , G06F18/25
Abstract: 本公开提供了一种数据处理方法及计算机可读存储介质,所述数据处理方法用于对命名实体识别模型进行训练,包括:获取有标签训练样本对和无标签训练样本对;对应每个训练样本对,得到相应训练样本对对应的潜在表示特征并融合,进而,通过进行命名实体预测,得到有标签训练样本对的第一预测结果,以及无标签训练样本对的第二预测结果;根据每个训练样本对的潜在表示特征得到相应训练样本对的重构特征;基于第一预测结果、第二预测结果、各样本对和各样本对的重构特征确定三个损失函数,根据三个损失函数对命名实体识别模型进行训练。本公开实施例采用半监督训练,能够在保证模型准确率的情况下降低训练成本。
-
-