-
公开(公告)号:CN119849501A
公开(公告)日:2025-04-18
申请号:CN202510317358.5
申请日:2025-03-18
Applicant: 中南大学
IPC: G06F40/295 , G06F40/253 , G06F40/30 , G06N3/0442 , G06N3/0455 , G06N3/047 , G06N3/048 , G06N3/082
Abstract: 本发明公开了一种基于通道注意力和字符特征的文本命名实体提取方法。包括获取待识别的输入文本;构建命名实体识别模型,包括:BERT模型用于获取具有上下文信息的特征、语法结构和语义表示;CharCNN模块用于提取BERT模型输出结果中的字符级特征;DSENet模块用于增强BERT模型输出结果中的实体内容和实体位置特征表达;多层双向长短时记忆网络用于捕捉以上模块的输出进行特征融合后的融合结果中的长距离依赖关系;条件随机场用于对输出序列进行实体标注;将待识别的输入文本输入命名实体识别模型中,获得命名实体。本发明方案提升了实体识别的效果,在非结构化文本NER任务中具有较高的准确率和召回率。