-
公开(公告)号:CN119005187A
公开(公告)日:2024-11-22
申请号:CN202310581034.3
申请日:2023-05-22
Applicant: 南京大学
IPC: G06F40/295 , G06F40/186 , G06N3/08
Abstract: 本发明的技术方案一种基于持续学习和提示模板的通用命名实体识别方法。本发明的特点在于:1.本方法只需要少量的过去实体的注释样本;2.本发明不需要扩展神经网络层,也不需要每次都复制新的编码器层来构建新的模型。本方法总是在同一个模型上进行训练,这样可以避免存储空间的浪费,也不需要每次动态调整和重新训练模型的输出层;3.本发明创新的结合了基于代表性困难度的样本重放方法和基于EWC的正则化方法,大大减轻了由于灾难性遗忘问题导致持续学习中NER模型表现迅速下降的问题。本发明可以指导开发人员更好的完成类增量设置下的命名实体识别任务,快速准确的定位非结构化文本中的命名实体并将其分类为预先定义的类型。