-
公开(公告)号:CN116451691A
公开(公告)日:2023-07-18
申请号:CN202310297189.4
申请日:2023-03-24
Applicant: 燕山大学
IPC: G06F40/295 , G06N3/09 , G06N3/0464
Abstract: 本发明公开了一种实体层次信息增强原型表征的小样本命名实体识别方法,属于自然语言处理技术领域。主要包括两个模块:1)边界识别模块:将训练数据输入到边界识别模块,检测实体跨度在句子中的边界;2)实体分类模块:使用同一个编码器训练数据和实体层次的分支描述进行编码,得到分支描述表征和原始原型表征;通过三仿射注意力机制将实体层次的分支描述融入到原始原型表征中,得到层次指导的原型表征;使用层次‑示例对比学习方法,拉进与层次原型同类样本之间的距离,拉远与之不同类样本的距离。本发明方法通过挖掘文本描述的实体层次信息,向原型表征中引入实体层次信息能够有效增强实体类原型的表征能力,从而增强小样本命名实体识别能力。