-
公开(公告)号:CN117787281A
公开(公告)日:2024-03-29
申请号:CN202311839688.8
申请日:2023-12-28
Applicant: 北京信息科技大学
IPC: G06F40/295 , G06N3/049 , G06N3/0464 , G06N3/08 , G06N3/045 , G06N3/0475 , G06N3/094 , G06F40/30 , G06F16/35
Abstract: 本发明公开了一种面向古籍的命名实体识别方法,涉及古籍命名实体识别技术领域,该方法针对用于古籍命名实体识别古籍语料少、古文信息熵高的问题,构建基于二十四史的古籍文本语料库,并提出一种基于增量预训练和对抗学习的古籍命名实体识别模型(ANER‑IPAL)。基于自建的古籍文本数据集,使用NEZHA‑TCN模型进行预训练,在嵌入层融合对抗学习增强模型泛化能力,在解码层引入全局指针网络,将实体识别任务建模为子串提取任务,最后结合规则进行结果的矫正输出。实验结果表明,所提模型在“古籍命名实体识别2023”数据集(GuNER2023)上的F1值达到了95.34%,相较于基线模型NEZHA‑GP提高了4.19%。