一种基于图卷积神经网络和知识库的论文相关性分析方法

    公开(公告)号:CN114741519B

    公开(公告)日:2024-12-03

    申请号:CN202210150878.8

    申请日:2022-02-18

    Abstract: 本发明提出了一种新的论文相关性分析方法:在论文集中提取关键信息,构建论文集知识库,结合图卷积神经网络,提出改进的Inception‑GCN模型完成论文类别划分,使用NOCO模型完成论文社区发现,进而完成论文集知识库中论文的相关性分析。本发明提出一个新的图节点分类模型:Inception‑GCN模型。将原本用于CNN模型的Inception方法与GCN模型结合,能够使新模型在增强特征学习能力的同时,有效的解决过拟合问题和平滑问题。通过实验表明,将该模型用于论文节点分类,可以达到比现有技术更好的效果。

    一种基于图卷积神经网络和知识库的论文相关性分析方法

    公开(公告)号:CN114741519A

    公开(公告)日:2022-07-12

    申请号:CN202210150878.8

    申请日:2022-02-18

    Abstract: 本发明提出了一种新的论文相关性分析方法:在论文集中提取关键信息,构建论文集知识库,结合图卷积神经网络,提出改进的Inception‑GCN模型完成论文类别划分,使用NOCO模型完成论文社区发现,进而完成论文集知识库中论文的相关性分析。本发明提出一个新的图节点分类模型:Inception‑GCN模型。将原本用于CNN模型的Inception方法与GCN模型结合,能够使新模型在增强特征学习能力的同时,有效的解决过拟合问题和平滑问题。通过实验表明,将该模型用于论文节点分类,可以达到比现有技术更好的效果。

    一种结合信息量和BERT-BiLSTM-CRF的NLP知识图谱构建方法

    公开(公告)号:CN114817454A

    公开(公告)日:2022-07-29

    申请号:CN202210150583.0

    申请日:2022-02-18

    Abstract: 本发明公开了一种结合信息量和BERT‑BiLSTM‑CRF的NLP知识图谱构建方法,通过分析知网期刊论文数据的结构并结合自然语言处理的研究任务提出自然语言处理领域知识图谱的模式层结构;之后通过提出一种新词发现的算法获得论文数据中的关键术语实体类,提出一种特征融合多分类的算法获得论文细粒度的NLP研究任务实体类。进而完成知识抽取模块对三元组的获取,最终构建完成自然语言处理知识图谱。本发明的新词识别算法弥补了传统技术上仅仅使用信息量来获取新词的缺陷,极大地提高了新词发现的效果。使用XGBoost模型对论文细粒度研究任务的分类相比于其他机器学习模型准确率较高,此外经过特征融合,分类模型的准确率相比于未经特征融合模型的分类准确率提升了约五个百分点。

    一种结合信息量和BERT-BiLSTM-CRF的NLP知识图谱构建方法

    公开(公告)号:CN114817454B

    公开(公告)日:2024-11-08

    申请号:CN202210150583.0

    申请日:2022-02-18

    Abstract: 本发明公开了一种结合信息量和BERT‑BiLSTM‑CRF的NLP知识图谱构建方法,通过分析知网期刊论文数据的结构并结合自然语言处理的研究任务提出自然语言处理领域知识图谱的模式层结构;之后通过提出一种新词发现的算法获得论文数据中的关键术语实体类,提出一种特征融合多分类的算法获得论文细粒度的NLP研究任务实体类。进而完成知识抽取模块对三元组的获取,最终构建完成自然语言处理知识图谱。本发明的新词识别算法弥补了传统技术上仅仅使用信息量来获取新词的缺陷,极大地提高了新词发现的效果。使用XGBoost模型对论文细粒度研究任务的分类相比于其他机器学习模型准确率较高,此外经过特征融合,分类模型的准确率相比于未经特征融合模型的分类准确率提升了约五个百分点。

Patent Agency Ranking