-
公开(公告)号:CN116205227A
公开(公告)日:2023-06-02
申请号:CN202310259247.4
申请日:2023-03-17
Applicant: 东南大学
IPC: G06F40/289 , G06F40/216 , G06N5/04 , G06F18/23 , G06N3/049 , G06N3/08 , G06N3/0442
Abstract: 本发明提供了一种基于变分推断理论的关键词生成方法及系统,方法包括以下步骤:步骤1:数据预处理;步骤2:模型构建;步骤3:模型训练;步骤4:模型测试与评估。本发明针对现存的关键词生成方法依赖基本的序列到序列的框架来生成目标关键词,忽视了复制和生成空间表征学习能力不足的问题,通过对变分推断理论的分析,将变分推断引入关键词生成任务并建立基于双隐空间的关键词生成模型,以期达到生成高质量的关键词并利用混合高斯模块的特性根据文本内容自适应预关键词个数的目的。
-
公开(公告)号:CN115774995A
公开(公告)日:2023-03-10
申请号:CN202211538484.6
申请日:2022-12-02
Applicant: 东南大学
IPC: G06F40/284 , G06F40/289 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于最优传输理论的关键词生成方法,如图1所示,方法包括以下步骤:步骤1:数据预处理;步骤2:损失函数构建;步骤3:模型训练;步骤4:模型测试与评估。本发明基于最优传输理论构建损失函数,加强模型捕获文本语义信息的能力,进而使得模型能够生成更加贴合文本语义的关键词,降低与文本语义无关甚至相悖的缺失关键词的出现,提升关键词的质量。
-