-
公开(公告)号:CN114691860A
公开(公告)日:2022-07-01
申请号:CN202011560064.9
申请日:2020-12-25
Applicant: 北京达佳互联信息技术有限公司
IPC: G06F16/35 , G06F40/284 , G06K9/62 , G06N3/08 , G06F16/9535
Abstract: 本公开提供了一种文本分类模型的训练方法、装置、电子设备及存储介质,属于机器学习技术领域。方法包括:基于本次迭代过程对应的文本分类模型对样本标题文本进行分类,得到样本标题文本的概率向量;确定第一类别标签的目标标签权重,第一类别标签为样本标题文本所属的类别标签,目标标签权重的大小与属于第一类别标签的样本标题文本的数量成反比;根据概率向量和目标标签权重,确定本次迭代过程的第一损失值;响应于第一损失值符合目标条件,将文本分类模型作为训练完毕的文本分类模型。上述方法,使训练得到的文本分类模型能够对数据量较少的类别标签的特征进行有效的学习,从而提高文本分类模型的准确率。
-
公开(公告)号:CN113032560B
公开(公告)日:2023-10-27
申请号:CN202110279651.9
申请日:2021-03-16
Applicant: 北京达佳互联信息技术有限公司
IPC: G06F16/35 , G06F18/214 , G06F18/2411
Abstract: 本公开提供了一种语句分类模型训练方法、语句处理方法及设备,涉及计算机技术领域。本公开实施例的方法及装置,一方面,对样本语句对应的字向量信息中部分字的字向量进行了更改,将更改后的字向量信息作为样本语句分类的依据,使得语句分类模型对更改的样本语句依旧能够准确进行分类,增强了该语句分类模型对语句发生不定更改的适应性和抵抗性,提高了语句分类模型的鲁棒性。另一方面,通过更改样本语句中部分字的字向量,能够改变语句分类模型的关注点,训练过程使得该语句分类模型还能够对其进行准确分类,也就使得语句分类模型关注全局特征,不会过度关注局部特征,避免出现过度拟合的情况,提高语句分类模型的预测准确性。
-
公开(公告)号:CN113032560A
公开(公告)日:2021-06-25
申请号:CN202110279651.9
申请日:2021-03-16
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本公开提供了一种语句分类模型训练方法、语句处理方法及设备,涉及计算机技术领域。本公开实施例的方法及装置,一方面,对样本语句对应的字向量信息中部分字的字向量进行了更改,将更改后的字向量信息作为样本语句分类的依据,使得语句分类模型对更改的样本语句依旧能够准确进行分类,增强了该语句分类模型对语句发生不定更改的适应性和抵抗性,提高了语句分类模型的鲁棒性。另一方面,通过更改样本语句中部分字的字向量,能够改变语句分类模型的关注点,训练过程使得该语句分类模型还能够对其进行准确分类,也就使得语句分类模型关注全局特征,不会过度关注局部特征,避免出现过度拟合的情况,提高语句分类模型的预测准确性。
-
-