一种基于变分推断理论的关键词生成方法及系统

    公开(公告)号:CN116205227A

    公开(公告)日:2023-06-02

    申请号:CN202310259247.4

    申请日:2023-03-17

    Applicant: 东南大学

    Abstract: 本发明提供了一种基于变分推断理论的关键词生成方法及系统,方法包括以下步骤:步骤1:数据预处理;步骤2:模型构建;步骤3:模型训练;步骤4:模型测试与评估。本发明针对现存的关键词生成方法依赖基本的序列到序列的框架来生成目标关键词,忽视了复制和生成空间表征学习能力不足的问题,通过对变分推断理论的分析,将变分推断引入关键词生成任务并建立基于双隐空间的关键词生成模型,以期达到生成高质量的关键词并利用混合高斯模块的特性根据文本内容自适应预关键词个数的目的。

    一种基于图神经网络和强化学习的事实验证方法

    公开(公告)号:CN115511082A

    公开(公告)日:2022-12-23

    申请号:CN202211085132.X

    申请日:2022-09-06

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于图神经网络和强化学习的事实验证方法,能够验证语料库中陈述语句和表格型数据中的事实是否相符,基于Transformer的图神经网络来模拟多步推理过程,步骤如下:首先,通过图神经网络将不同类型的边编码为独立的向量,并利用自注意力机制对提取的多粒度特征进行邻居信息聚合,然后,设计一个监控节点,根据强化学习的奖励反馈,在每个图神经网络层上选择合适的证据词,通过对多个图神经网络层的信息聚合,监控节点可捕获各种潜在的关键证据,进行最终验证。最后,为了更加有效地学习聚集的证据信息,本发明利用Transformer设计了能够更加充分利用表格中证据信息的多步推理框架,提高事实验证模型的准确性。

    一种基于最优传输理论的关键词生成方法

    公开(公告)号:CN115774995A

    公开(公告)日:2023-03-10

    申请号:CN202211538484.6

    申请日:2022-12-02

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于最优传输理论的关键词生成方法,如图1所示,方法包括以下步骤:步骤1:数据预处理;步骤2:损失函数构建;步骤3:模型训练;步骤4:模型测试与评估。本发明基于最优传输理论构建损失函数,加强模型捕获文本语义信息的能力,进而使得模型能够生成更加贴合文本语义的关键词,降低与文本语义无关甚至相悖的缺失关键词的出现,提升关键词的质量。

Patent Agency Ranking