-
公开(公告)号:CN114048750B
公开(公告)日:2024-06-28
申请号:CN202111510990.X
申请日:2021-12-10
Applicant: 广东工业大学
IPC: G06F40/295 , G06F40/242 , G06F18/2415 , G06N3/045 , G06N3/0464 , G06N3/0455 , G06N3/047
Abstract: 本发明涉及自然语言处理技术领域,公开了一种融合信息高级特征的命名实体识别方法,包括以下具体步骤:S1.获取待分析文本信息,并进行预处理,得到预处理后的文本特征;S2.将得到的预处理后的文本特征输入到深度卷积神经网络提取文本中的字符级特征,将提取的字符级特征输入全连接网络,获得字符的最佳特征表示;S3.通过得到的字符级特征和文本信息,得到lattice,并进行lattice嵌入,得到集成表示;S4.连接所述的集成表示和最佳特征表示,并用Transformer作为编码器,以条件随机场进行解码,得到词与词之间的关系,并进行实体识别。本发明解决了现有技术不能够可靠高效地提取命名实体的问题,有计算方便,实用高效的特点。
-
公开(公告)号:CN114048750A
公开(公告)日:2022-02-15
申请号:CN202111510990.X
申请日:2021-12-10
Applicant: 广东工业大学
IPC: G06F40/295 , G06F40/242 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明涉及自然语言处理技术领域,公开了一种融合信息高级特征的命名实体识别方法,包括以下具体步骤:S1.获取待分析文本信息,并进行预处理,得到预处理后的文本特征;S2.将得到的预处理后的文本特征输入到深度卷积神经网络提取文本中的字符级特征,将提取的字符级特征输入全连接网络,获得字符的最佳特征表示;S3.通过得到的字符级特征和文本信息,得到lattice,并进行lattice嵌入,得到集成表示;S4.连接所述的集成表示和最佳特征表示,并用Transformer作为编码器,以条件随机场进行解码,得到词与词之间的关系,并进行实体识别。本发明解决了现有技术不能够可靠高效地提取命名实体的问题,有计算方便,实用高效的特点。
-