一种基于注意力机制和BiLSTM的中文命名实体识别模型

    公开(公告)号:CN116306652A

    公开(公告)日:2023-06-23

    申请号:CN202310247389.9

    申请日:2023-03-15

    Abstract: 本发明公开的属于信息科学技术领域,具体为一种基于注意力机制和BiLSTM的中文命名实体识别模型,包括:嵌入层,用于获取字符集嵌入、上下文编码层,用于抽取上下文特征、特征融合层,用于利用注意力机制进行融合、解码层,用于利用条件随机场进行解码,所述嵌入层与所述上下文编码层相连接,所述上下文编码层与所述特征融合层相连接,所述特征融合层与所述解码层相连接,本发明通过使用改进的Transformer编码器和双向长短期记忆网络可以同时获得全局语义信息和方向信息,同时词向量嵌入方法是RoBERTa预训练模型,这种模型可以获得更多的上下文语义信息和词汇信息,增强实体识别效果。

Patent Agency Ranking