-
公开(公告)号:CN117787255A
公开(公告)日:2024-03-29
申请号:CN202310593800.8
申请日:2023-05-24
Applicant: 电子科技大学
IPC: G06F40/216 , G06F40/289 , G06F40/194 , G06F40/242 , G06F40/247 , G06F16/34
Abstract: 本发明公开的一种基于关键术语库引导的特定领域文本自动摘要方法,包括如下步骤:S1、构建特定领域术语库,S2、构建基于关键术语库引导的关系图,在所述关键术语库中的句子和关键词、句子和句子、关键词与关键词之间建立联系;S3、基于排序算法对关系图中各节点的重要性权值进行迭代计算,对收敛后的结果进行排序输出完成抽取。本发明将处理后的数据构成关键属于库,术语库中包括句子与关键词,改进传统图模型的构建,对含有关键属于库中包含关键信息的句子给予更大的关注度,相比现有技术中其他的文本摘要提取方法,本发明在特定领域下(云ERP生态社区)摘要抽取更准确。
-
公开(公告)号:CN115062140A
公开(公告)日:2022-09-16
申请号:CN202210593675.6
申请日:2022-05-27
Applicant: 电子科技大学
IPC: G06F16/34 , G06F40/211 , G06F40/289 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种BERT SUM和PGN融合的供应链生态区长文档摘要生成方法,包括如下步骤:对数据集进行预处理,所述的预处理包括对数据集内的文档进行分句得到句子,对句子进行分词得到词;对句子和词进行编码,对段落标识进行编码,对句子的位置进行编码,根据句子和词的编码、段落标识的编码、句子的位置编码,基于BERT预训练模型获取句子向量;根据BERT预训练模型输出的句子向量,基于transformer捕获文档级特征;将抽取的关键句形成过渡文档输入到生成模型中;基于指针生成网络复制或生成字词级信息;生成文档摘要。本发明使用BERT作为文本摘要抽取部分的编码,利于机器理解文本的语义信息,提高最终文本摘要的效果。
-