-
公开(公告)号:CN113449517A
公开(公告)日:2021-09-28
申请号:CN202110773065.X
申请日:2021-07-08
Applicant: 福建工程学院
IPC: G06F40/279 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本发明公开基于BERT门控多窗口注意力网络模型的实体关系抽取方法,对数据集进行预处理;利用最短依存路径解析数据集生成相应的约束信息;采用BERT编码原始序列及其约束信息构建单词的动态语义表示特征、并通过语义表示特征形成句子向量、实体向量表示以及约束信息向量表示;构建了一种关键词组提取网络,采用多窗口CNN获取句子中多粒度词组特征并采用逐元最大池化筛选出关键词组特征;使用自注意力机制和BiLSTM‑Attention对关键词组特征进行筛选和全局感知,形成用于分类的整体特征;利用全连接层和Softmax分类函数进行分类处理。本发明提高了关系抽取的准确率。
-
公开(公告)号:CN113449517B
公开(公告)日:2023-03-28
申请号:CN202110773065.X
申请日:2021-07-08
Applicant: 福建工程学院
IPC: G06F40/279 , G06F40/30 , G06N3/0464 , G06N3/08
Abstract: 本发明公开基于BERT门控多窗口注意力网络模型的实体关系抽取方法,对数据集进行预处理;利用最短依存路径解析数据集生成相应的约束信息;采用BERT编码原始序列及其约束信息构建单词的动态语义表示特征、并通过语义表示特征形成句子向量、实体向量表示以及约束信息向量表示;构建了一种关键词组提取网络,采用多窗口CNN获取句子中多粒度词组特征并采用逐元最大池化筛选出关键词组特征;使用自注意力机制和BiLSTM‑Attention对关键词组特征进行筛选和全局感知,形成用于分类的整体特征;利用全连接层和Softmax分类函数进行分类处理。本发明提高了关系抽取的准确率。
-