-
公开(公告)号:CN114662476B
公开(公告)日:2024-09-24
申请号:CN202210177253.0
申请日:2022-02-24
Applicant: 北京交通大学
IPC: G06F40/295 , G06F40/242 , G06F40/30 , G06F40/216 , G06N3/0455 , G06N3/047 , G06N3/0985 , G06N5/04
Abstract: 本发明提供了一种融合词典与字符特征的字符序列识别方法。该方法包括:获取输入序列中的每个字符匹配的词典中的三类词典匹配词,将输入字符序列的每个字符嵌入向量与该字符对应的三类词典匹配词集嵌入向量进行拼接,得到词典增强的字符嵌入向量;将词典增强的字符嵌入向量与三类词典匹配词进行拼接后,送入Transformer的编码层,Transformer的编码层输出待解码信息;将待解码信息输入至条件随机场CRF解码层进行解码,得到输入序列的标注结果。本发明的方法通过综合词典的匹配词在字符嵌入、模型推理阶段对字符特征的交互、匹配词以及字符的位置信息增强的向量表示,从而有效地增强模型对文本句子在嵌入过程以及推理过程中对语义信息的表示与理解。
-
公开(公告)号:CN114662476A
公开(公告)日:2022-06-24
申请号:CN202210177253.0
申请日:2022-02-24
Applicant: 北京交通大学
IPC: G06F40/242 , G06F40/295 , G06F40/30 , G06F40/216 , G06N3/08 , G06N5/04
Abstract: 本发明提供了一种融合词典与字符特征的字符序列识别方法。该方法包括:获取输入序列中的每个字符匹配的词典中的三类词典匹配词,将输入字符序列的每个字符嵌入向量与该字符对应的三类词典匹配词集嵌入向量进行拼接,得到词典增强的字符嵌入向量;将词典增强的字符嵌入向量与三类词典匹配词进行拼接后,送入Transformer的编码层,Transformer的编码层输出待解码信息;将待解码信息输入至条件随机场CRF解码层进行解码,得到输入序列的标注结果。本发明的方法通过综合词典的匹配词在字符嵌入、模型推理阶段对字符特征的交互、匹配词以及字符的位置信息增强的向量表示,从而有效地增强模型对文本句子在嵌入过程以及推理过程中对语义信息的表示与理解。
-