一种基于论文摘要QA的TopK实体抽取方法与系统

    公开(公告)号:CN112651244A

    公开(公告)日:2021-04-13

    申请号:CN202011566711.7

    申请日:2020-12-25

    Abstract: 本发明提供了一种基于论文摘要QA的TopK实体抽取方法与系统,该方法包括数据获取与处理步骤:从数据库中获取相关领域的所有论文,以及从dbpedia官网获取实体库,并整合数据库中的实体,获得dbace实体集;训练相似度模型步骤:进行文本相似度模型训练;构建ES索引步骤:将dbace实体集中的每个实体经过stem处理;检索实体步骤:将论文摘要QA句子送入ES中进行查询;实体特征计算步骤:计算实体列表中的实体与其论文标题、论文摘要和论文摘要QA的相关分数,并计算实体长度和复杂度;训练LTR模型步骤:选取部分文章的实体列表进行人工标注;结果可视化步骤:将单篇论文各个论文摘要QA下的实体列表进行lambdaRank排序。本发明能够使得论文知识图谱构建变得快速、简单、可靠。

    基于生成对抗网络和隶属图模型的社区检测方法及系统

    公开(公告)号:CN112699312A

    公开(公告)日:2021-04-23

    申请号:CN202110055383.2

    申请日:2021-01-15

    Abstract: 本发明提供了一种基于生成对抗网络和隶属图模型的社区检测方法及系统,涉及文本网络探索式搜索技术领域,该方法包括:步骤1:基于原始数据生成待检测图;步骤2:基于所述待检测图生成其隶属图模型以初始化生成对抗网络;步骤3:基于隶属图模型并用策略梯度法最优化生成对抗网络;步骤4:根据最优化后的生成对抗网络,预测各社区的成员节点及成员间关系。本发明能够实现将社区检测和图表征学习在一个统一的学习框架内进行了结合,大幅度提升了模型性能。

    一种基于论文摘要QA的TopK实体抽取方法与系统

    公开(公告)号:CN112651244B

    公开(公告)日:2022-12-09

    申请号:CN202011566711.7

    申请日:2020-12-25

    Abstract: 本发明提供了一种基于论文摘要QA的TopK实体抽取方法与系统,该方法包括数据获取与处理步骤:从数据库中获取相关领域的所有论文,以及从dbpedia官网获取实体库,并整合数据库中的实体,获得dbace实体集;训练相似度模型步骤:进行文本相似度模型训练;构建ES索引步骤:将dbace实体集中的每个实体经过stem处理;检索实体步骤:将论文摘要QA句子送入ES中进行查询;实体特征计算步骤:计算实体列表中的实体与其论文标题、论文摘要和论文摘要QA的相关分数,并计算实体长度和复杂度;训练LTR模型步骤:选取部分文章的实体列表进行人工标注;结果可视化步骤:将单篇论文各个论文摘要QA下的实体列表进行lambdaRank排序。本发明能够使得论文知识图谱构建变得快速、简单、可靠。

Patent Agency Ranking