-
公开(公告)号:CN116579343B
公开(公告)日:2024-06-04
申请号:CN202310560194.X
申请日:2023-05-17
Applicant: 成都信息工程大学
IPC: G06F40/295 , G06N3/045 , G06N3/0442 , G06N3/0464 , G06N3/048 , G06N3/084
Abstract: 本发明公开了一种中文文旅类的命名实体识别方法,包括以下步骤:S1、获取中文文旅类文本数据,并将其输入至字符嵌入层,得到字符向量表示;S2、将字符向量表示输入至双向长短期记忆网络层,得到上下文表示;S3、将上下文表示输入至CNN层,得到多尺度的局部上下文特征融合表示;S4、将多尺度的局部上下文特征融合表示输入至CRF层,通过CRF层进行序列标注,完成中文文旅类的命名实体识别。本发明考虑到对中文旅游类的命名实体识别研究的关注度较少的问题,针对于中文的文旅类文本数据进行网络搭建,在CNN层利用第二CNN模块学习多尺度的局部上下文特征融合表示,加强语义之间的相关性,提高有利于中文识别的特征表示。
-
公开(公告)号:CN116629264B
公开(公告)日:2024-01-23
申请号:CN202310594598.0
申请日:2023-05-24
Applicant: 成都信息工程大学
IPC: G06F40/295 , G06F40/30 , G06F40/289 , G06N3/0464 , G06Q30/0203 , G06Q50/14
Abstract: 本发明公开了一种基于多个词嵌入和多头自注意力机制的关系抽取方法,包括以下步骤:S1、获取第一句子向量,将第一句子向量依次输入双向长短记忆网络层和注意力层,得到第一特征向量;S2、获取第二句子向量,将第二句子向量依次输入多窗口卷积层、多头自注意力层和最大池化层,得到第二特征向量;S3、将第一特征向量和第二特征向量均输入门控特征融合层,得到融合结果;S4、将融合结果输入Softmax层,得到关系预测结果,完成关系抽取。本发明使用字符嵌入的方式,不构建外部知识库也能有效地从字符层面和词组层面挖掘句子信息来充分表达句子语义,并且避免分词错误带来的影响、缓解一词多义难题。
-
公开(公告)号:CN116579343A
公开(公告)日:2023-08-11
申请号:CN202310560194.X
申请日:2023-05-17
Applicant: 成都信息工程大学
IPC: G06F40/295 , G06N3/045 , G06N3/0442 , G06N3/0464 , G06N3/048 , G06N3/084
Abstract: 本发明公开了一种中文文旅类的命名实体识别方法,包括以下步骤:S1、获取中文文旅类文本数据,并将其输入至字符嵌入层,得到字符向量表示;S2、将字符向量表示输入至双向长短期记忆网络层,得到上下文表示;S3、将上下文表示输入至CNN层,得到多尺度的局部上下文特征融合表示;S4、将多尺度的局部上下文特征融合表示输入至CRF层,通过CRF层进行序列标注,完成中文文旅类的命名实体识别。本发明考虑到对中文旅游类的命名实体识别研究的关注度较少的问题,针对于中文的文旅类文本数据进行网络搭建,在CNN层利用第二CNN模块学习多尺度的局部上下文特征融合表示,加强语义之间的相关性,提高有利于中文识别的特征表示。
-
公开(公告)号:CN116629264A
公开(公告)日:2023-08-22
申请号:CN202310594598.0
申请日:2023-05-24
Applicant: 成都信息工程大学
IPC: G06F40/295 , G06F40/30 , G06F40/289 , G06N3/0464 , G06Q30/0203 , G06Q50/14
Abstract: 本发明公开了一种基于多个词嵌入和多头自注意力机制的关系抽取方法,包括以下步骤:S1、获取第一句子向量,将第一句子向量依次输入双向长短记忆网络层和注意力层,得到第一特征向量;S2、获取第二句子向量,将第二句子向量依次输入多窗口卷积层、多头自注意力层和最大池化层,得到第二特征向量;S3、将第一特征向量和第二特征向量均输入门控特征融合层,得到融合结果;S4、将融合结果输入Softmax层,得到关系预测结果,完成关系抽取。本发明使用字符嵌入的方式,不构建外部知识库也能有效地从字符层面和词组层面挖掘句子信息来充分表达句子语义,并且避免分词错误带来的影响、缓解一词多义难题。
-
-
-