-
公开(公告)号:CN111797234A
公开(公告)日:2020-10-20
申请号:CN202010550434.4
申请日:2020-06-16
Applicant: 北京北大软件工程股份有限公司
IPC: G06F16/35 , G06F40/211 , G06F40/284 , G06F40/30 , G06K9/62
Abstract: 本发明公开了一种自然语言处理分类模型中多标签分布学习的方法和系统,属于自然语言处理领域。在获取训练样本后,分别计算得到每个标签的标签向量和每个样本的样本向量;然后根据标签向量和样本向量计算得到每个样本与每个标签之间的相关性;再通过每个样本与每个标签之间的相关性计算得到每个样本的标签分布;最后根据标签分布更新自然处理分类模型。通过这种方式,能够使经过更新后的自然处理分类模型的样本得到更准确的标签,大大提高了自然处理分类模型的泛化能力。
-
公开(公告)号:CN111797234B
公开(公告)日:2024-04-30
申请号:CN202010550434.4
申请日:2020-06-16
Applicant: 北京北大软件工程股份有限公司
IPC: G06F16/35 , G06F40/211 , G06F40/284 , G06F40/30 , G06F18/214
Abstract: 本发明公开了一种自然语言处理分类模型中多标签分布学习的方法和系统,属于自然语言处理领域。在获取训练样本后,分别计算得到每个标签的标签向量和每个样本的样本向量;然后根据标签向量和样本向量计算得到每个样本与每个标签之间的相关性;再通过每个样本与每个标签之间的相关性计算得到每个样本的标签分布;最后根据标签分布更新自然处理分类模型。通过这种方式,能够使经过更新后的自然处理分类模型的样本得到更准确的标签,大大提高了自然处理分类模型的泛化能力。
-