基于主题挖掘的水利领域文本的检索方法与系统

    公开(公告)号:CN114490938A

    公开(公告)日:2022-05-13

    申请号:CN202210079358.2

    申请日:2022-01-24

    Applicant: 河海大学

    Inventor: 冯钧 苏栋 陆佳民

    Abstract: 本发明公开了一种基于主题挖掘的水利领域文本的检索方法与系统,所述方法步骤如下:收集数据集;数据集预处理;构建基于主题挖掘的双向对抗神经网络和双向GRU联合的主题注意力模型GAN‑BiGRU Topic Attention Model;测试集验证测试;主题相关排序;进行主题检索;所述系统包括数据爬取模块、索引构建模块与数据检索模块。本发明在主题多样性检测及主题连贯性检测和下游分类任务的准确率与召回率都显著高于现有方法,为本相关领域研究提供了一种新的解决方案;本发明立足于充足的领域数据储备支撑,率先将双向对抗神经网络和双向GRU组合形成的网络模型使用在水利检索领域,为主题模型检索在水利领域的应用做出贡献。

Patent Agency Ranking