-
公开(公告)号:CN116595981A
公开(公告)日:2023-08-15
申请号:CN202310535453.3
申请日:2023-05-12
Applicant: 中车信息技术有限公司 , 北京交通大学
IPC: G06F40/295 , G06F40/30 , G06F16/33 , G06F16/35 , G06N3/0455 , G06N3/0464 , G06N3/048 , G06N3/084
Abstract: 本申请涉及一种实体抽取方法、装置、设备和存储介质。主要技术方案包括:获取语料信息,对语料信息进行分词处理,得到字符序列和单词序列;将字符序列输入多重嵌入模块,得到字符级嵌入向量序列,以及将单词序列输入多重嵌入模块,得到单词级嵌入向量序列;将字符级嵌入向量序列进行编码处理,得到字符级编码向量序列;将字符级编码向量序列与单词级嵌入向量序列进行拼接运算,得到拼接向量序列;将拼接向量序列进行解码操作后输入全局特征捕获输出模块,得到实体标签序列。本申请通过多重嵌入模块实现对语料多重特征的融合;通过全局特征捕获输出模块充分考虑语料的整体特征信息并输出,以达到提高实体抽取的准确度的效果。