-
公开(公告)号:CN116306868B
公开(公告)日:2024-01-05
申请号:CN202310217203.5
申请日:2023-03-01
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N3/08
Abstract: 本说明书实施例公开了一种模型的处理方法、装置及设备,该方法包括:将目标域的目标数据分别输入第一教师模型和第二教师模型中,得到第一教师模型对应的第一输出数据和第二教师模型对应的第二输出数据,第一教师模型是源域的模型,第二教师模型是目标域的模型;将目标数据输入到数据选择模型中,得到第一教师模型和第二教师模型的重要性权重,并基于上述重要性权重和两个输出数据,确定目标数据对应的教师输出结果;将目标数据输入到第一学生模型中,得到目标数据对应的第一学生输出结果;基于教师输出结果、第一学生输出结果和目标数据对应的标签信息,通过预设的损失函数,使用第一教师模型和第二教师模型对第一学生模型进行知识蒸馏训练。
-
公开(公告)号:CN116306868A
公开(公告)日:2023-06-23
申请号:CN202310217203.5
申请日:2023-03-01
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N3/08
Abstract: 本说明书实施例公开了一种模型的处理方法、装置及设备,该方法包括:将目标域的目标数据分别输入第一教师模型和第二教师模型中,得到第一教师模型对应的第一输出数据和第二教师模型对应的第二输出数据,第一教师模型是源域的模型,第二教师模型是目标域的模型;将目标数据输入到数据选择模型中,得到第一教师模型和第二教师模型的重要性权重,并基于上述重要性权重和两个输出数据,确定目标数据对应的教师输出结果;将目标数据输入到第一学生模型中,得到目标数据对应的第一学生输出结果;基于教师输出结果、第一学生输出结果和目标数据对应的标签信息,通过预设的损失函数,使用第一教师模型和第二教师模型对第一学生模型进行知识蒸馏训练。
-