-
公开(公告)号:CN118114674A
公开(公告)日:2024-05-31
申请号:CN202410412924.6
申请日:2024-04-08
Applicant: 东北大学
IPC: G06F40/295 , G06F16/35 , G06F18/214 , G06F18/241 , G06N3/045 , G06N3/0455 , G06N3/0499 , G06N3/084 , G06N3/0985
Abstract: 本发明公开一种可用于小样本场景的命名实体识别方法,涉及自然语言处理中的命名实体识别技术领域。本发明中包括一种新的编码二维坐标表的方法,在二维坐标表中对每个坐标对应的Span段同时对其是否为某一实体的任一边界和是否为某一实体的左右边界进行标注,每个训练样例可以产生更多有效的训练对,可以有效缓解训练样例信息利用不充分问题,此编码还可以通过解码输出的标注结果方式处理命名实体嵌套及不连续问题,此外,使用了一种单双边界交叉注意力模块,有助于模型识别效果,为了缓解小样本样例不足、训练困难的问题,本发明进一步利用不同任务中对应的不同命名实体类型作为提示词,增加训练的信息,降低任务的难度。