-
公开(公告)号:CN111400487B
公开(公告)日:2024-09-20
申请号:CN202010178615.9
申请日:2020-03-14
Applicant: 北京工业大学
IPC: G06F16/34 , G06F40/30 , G06F18/214
Abstract: 一种文本摘要质量评价方法属于自然语言处理领域,针对模型生成文本质量问题。深度学习下的文本生成技术已经取得了很大的进步,可以针对一篇文本生成相关的摘要,可以保证摘要的抽象性和多样性。但是深度学习模型生成的摘要还是存在词语重复,语义不相关的问题,不能直接用于生产环境,而且人工审核难度大。本方法针对深度学习模型生成的摘要进行质量评价,设计了语言质量网络和语义质量网络,主要从语法和语义两方面解决生成文本的质量评价问题。本方法使得摘要质量评价的效率得到很大提升。
-
公开(公告)号:CN111400487A
公开(公告)日:2020-07-10
申请号:CN202010178615.9
申请日:2020-03-14
Applicant: 北京工业大学
Abstract: 一种文本摘要质量评价方法属于自然语言处理领域,针对模型生成文本质量问题。深度学习下的文本生成技术已经取得了很大的进步,可以针对一篇文本生成相关的摘要,可以保证摘要的抽象性和多样性。但是深度学习模型生成的摘要还是存在词语重复,语义不相关的问题,不能直接用于生产环境,而且人工审核难度大。本方法针对深度学习模型生成的摘要进行质量评价,设计了语言质量网络和语义质量网络,主要从语法和语义两方面解决生成文本的质量评价问题。本方法使得摘要质量评价的效率得到很大提升。
-
公开(公告)号:CN110765768A
公开(公告)日:2020-02-07
申请号:CN201910981470.3
申请日:2019-10-16
Applicant: 北京工业大学
IPC: G06F40/284 , G06F40/247 , G06N3/04
Abstract: 一种优化的文本摘要生成方法属于自然语言生成领域,尤其涉及序列到序列文本摘要生成的相关方法。首先将中文数据进行清洗等预处理,将文章送入Encoder端的AS-CNN模型提取特征,然后将特征送入由Transformer组成的Decoder端。该网络不仅可以利用CNN网络与Transformer的并行能力,充分发挥硬件的效果加快训练速度,而且在Encoder端使用CNN,减少了模型的参数,避免过拟合问题,也扩展了模型的使用范围。
-
公开(公告)号:CN110765264A
公开(公告)日:2020-02-07
申请号:CN201910981403.1
申请日:2019-10-16
Applicant: 北京工业大学
IPC: G06F16/34 , G06F16/33 , G06F16/36 , G06F40/30 , G06F40/247
Abstract: 一种增强语义相关性的文本摘要生成方法属于文本生成领域。首先将海量中文数据进行去噪等预处理,然后将摘要经过预训练网络,获取文本对应的词向量,将需要做摘要的文章转为词向量送模型Encoder端进行特征表示。最后在模型Decoder端,将生成的摘要向量与预训练计算相似度与模型的LOSS值结合,进行模型的梯度计算。预训练向量有很好表达文本语义的能力,本发明将预训练向量与模型生成向量进行结合,不但可以减轻模型提取特征的压力,还可以保证模型生成的摘要语义与原文相同,解决生成摘要与原文不相关的问题。
-
-
-