-
公开(公告)号:CN115345165A
公开(公告)日:2022-11-15
申请号:CN202210990180.7
申请日:2022-08-18
Applicant: 北京邮电大学
IPC: G06F40/295 , G06K9/62 , G06N3/04
Abstract: 本发明公开了一种面向标签稀缺或分布不平衡场景的特定实体识别方法,提出了伪标签分布感知的自适应重采样策略和去混淆的边际损失函数,对训练集中标签数据分布的容忍度高,解决了域内标签稀缺场景下实体类别分布不平衡问题,显著改善实体识别模型在标签稀缺或分布不平衡的困难场景下的泛化性能,明显提高稀有类别的精确率、召回率和F1值等评价指标,适用于训练集中标签样本较少或不平衡度较高的特定实体识别任务。