-
公开(公告)号:CN115659978A
公开(公告)日:2023-01-31
申请号:CN202211331584.1
申请日:2022-10-28
Applicant: 北京理工大学
IPC: G06F40/295 , G06F40/126 , G06F16/31 , G06F16/33 , G06N3/0464 , G06N3/0499
Abstract: 本发明涉及多注意力机制跨度级小样本命名实体识别方法,属于自然语言处理领域。本发明首先对句子进行跨度枚举并通过BERT编码器编码生成跨度连贯性表示;其次,提出跨度内注意力机制关注重要字符信息,引入跨度间注意力机制关注与目标跨度相关度高的其他跨度;然后,利用跨度边界注意力机制关注支持集中实体跨度边界共有特征,利用实例级跨度注意力机制关注与查询集样本跨度相关度高的支持集样本跨度,生成实体类别原型;最后,通过计算支持集和查询集间距离进行实体类别预测。本发明能够改善token级基于度量元学习方法中的语义截断问题,有效提升小样本命名实体识别任务的准确率。