-
公开(公告)号:CN120012835A
公开(公告)日:2025-05-16
申请号:CN202510492694.3
申请日:2025-04-18
Applicant: 深圳华为云计算技术有限公司
IPC: G06N3/0455 , G06N3/096 , G06N5/04
Abstract: 本申请实施例公开了一种模型训练方法,该方法中,可以根据第一模型中的预设注意力模块的模型参数与第二模型中的MLA模块中的模型参数的相关性,将预设注意力模块中的模型权重变换为MLA模块的初始化的模型权重,以将预设注意力模块中的知识迁移至初始化后的MLA模块中,为初始化后的第二模型提供较好的知识基础,然后对MLA模块进行微调等小规模的训练即可获得性能较好的训练后的第二模型,而无需对第二模型从零开始执行完整的全流程训练过程,大大提升对第二模型的训练效率。
-
公开(公告)号:CN119848029A
公开(公告)日:2025-04-18
申请号:CN202311813147.8
申请日:2023-12-26
Applicant: 华为云计算技术有限公司
IPC: G06F16/215 , G06F16/22 , G06F16/28 , G06N20/00
Abstract: 本申请提供重复记录检测方法、装置及计算机可读存储介质,其中,方法步骤为获取记录对,然后将记录对输入第一重复记录检测模型,得到第一预测信息(包括第一重复记录检测模型预测记录对中的两个记录重复或者不重复的概率),在基于第一预测信息可确定记录对中的两个记录是否重复时输出确定结果,在基于第一预测信息不能确定记录对中的两个记录是否重复时,将记录对输入精度高于第一重复记录检测模型的第二重复记录检测模型,得到第二预测信息(包括第二重复记录检测模型预测记录对中的两个记录重复或者不重复的概率),基于第二预测信息确定记录对中的两个记录是否重复并输出确定结果。该方法可实现重复记录检测,并保证检测精度以及节省成本。
-