-
公开(公告)号:CN111914558B
公开(公告)日:2024-04-16
申请号:CN202010758190.9
申请日:2020-07-31
Applicant: 湖北工业大学
IPC: G06F40/295 , G06F40/211 , G06F16/35 , G06N3/0442 , G06N3/0464 , G06N3/045 , G06N3/08
Abstract: 本发明属于关系抽取技术领域,公开了一种基于句袋注意力远程监督的课程知识关系抽取方法及系统,通过TF‑IDF、TextRank、Word2vec词聚类三种关键词抽取算法抽取知识实体;基于人工标注的知识三元组,利用远程监督方法从课程教学文本中自动获取训练语料;用PCNN提取句子特征,采用句袋注意力机制对远程监督方法标注的数据中存在的大量噪声去噪;通过带有注意力的词向量捕捉上下文语义信息,并融合实体的位置信息、类型信息构造实体特征,输入Bi_LSTM模型获得知识点关系抽取。本发明不需要繁重的人工标注工作,减轻了人为构造特征的工作,可应用于不同科目的课程教学中,能对课程中的知识关系抽取取得很好的结果。
-
公开(公告)号:CN111914558A
公开(公告)日:2020-11-10
申请号:CN202010758190.9
申请日:2020-07-31
Applicant: 湖北工业大学
IPC: G06F40/295 , G06F40/211 , G06F16/35 , G06N3/04 , G06N3/08
Abstract: 本发明属于关系抽取技术领域,公开了一种基于句袋注意力远程监督的课程知识关系抽取方法及系统,通过TF-IDF、TextRank、Word2vec词聚类三种关键词抽取算法抽取知识实体;基于人工标注的知识三元组,利用远程监督方法从课程教学文本中自动获取训练语料;用PCNN提取句子特征,采用句袋注意力机制对远程监督方法标注的数据中存在的大量噪声去噪;通过带有注意力的词向量捕捉上下文语义信息,并融合实体的位置信息、类型信息构造实体特征,输入Bi_LSTM模型获得知识点关系抽取。本发明不需要繁重的人工标注工作,减轻了人为构造特征的工作,可应用于不同科目的课程教学中,能对课程中的知识关系抽取取得很好的结果。
-