基于层级交互注意力的文本摘要方法

    公开(公告)号:CN110472238B

    公开(公告)日:2022-11-18

    申请号:CN201910677195.6

    申请日:2019-07-25

    Abstract: 本发明涉及基于层级交互注意力的文本摘要方法,属于自然语言处理技术领域。本发明通过层级交互注意力提取编码器不同层次的特征息来指导摘要的生成。同时为了避免因引入不同层次特征而带来的信息冗余问题,利用变分信息瓶颈压缩数据噪声。本发明针对生成式文本摘要,在基于注意力的编解码框架下,通过注意力机制提取编码器多层上下文信息来指导解码过程,同时通过引入变分信息瓶颈对信息进行约束,从而提高生成式文本摘要的质量。实验结果表明该方法能够显著改善编解码框架在生成式摘要任务上的性能。

    基于案件要素句子关联图卷积的案件舆情摘要生成方法

    公开(公告)号:CN111339754B

    公开(公告)日:2022-06-21

    申请号:CN202010141405.2

    申请日:2020-03-04

    Abstract: 本发明涉及基于案件要素句子关联图卷积的案件舆情摘要生成方法,属于自然语言处理技术领域。本发明融合案件要素和词构建基于案件要素的句子关联图,来表征句子信息和句子之间的关联关系;使用图卷积神经网络学习句子信息和句子之间的关联关系,对句子进行分类,得到每个句子的重要性评分;按重要性对句子进行排序,通过去重和时序关系调整得到摘要。本发明实现了从涉及特定案件的多个新闻文本中,获取重要信息作为其简短摘要。对于相关人员快速掌控舆情态势有着重要的作用,解决了针对案件舆情摘要如何融入领域知识和跨文档句子关联关系的问题。

    融合关键词和语义特征的汉越文本相似度计算方法

    公开(公告)号:CN112257453B

    公开(公告)日:2022-02-22

    申请号:CN202011006911.7

    申请日:2020-09-23

    Abstract: 本发明涉及融合关键词和语义特征的汉越文本相似度计算方法,属于自然语言处理技术领域。本发明包括步骤:提取汉语、越南语文章的关键词,将越南语关键词翻译为中文,计算出两篇文章中的共现关键词,得到词的相似信息;然后利用共现关键词抽取出与其紧密相关的句子进行拼接来表征文本,并去除无关的句子以压缩文本;再利用知识蒸馏训练出汉越BERT模型对压缩后的文本进行编码,以获得上下文语义特征;最后将词的相似信息和上下文语义特征融合实现文本相关性判断。本发明提升了汉‑越文本相似度计算的准确率。

    融入观点句特征的汉越双语新闻情感分类方法

    公开(公告)号:CN110347836B

    公开(公告)日:2021-07-09

    申请号:CN201910635891.0

    申请日:2019-07-15

    Abstract: 本发明涉及融入观点句特征的汉越双语新闻情感分类方法,属于自然语言处理技术领域。本发明通过汉越双语词嵌入模型将汉语和越南语映射到同一个语义空间中;然后根据新闻文本的特点,使用卷积神经网络从观点句中抽取观点特征,并通过选择性门控网络将观点句特征融入隐藏层中,之后利用层次注意力机制对新闻中的情感信息进行关注,最后通过softmax对情感极性进行分类。本发明有效地提升越南语新闻情感分类的准确性。

    基于重读和反馈机制的神经机器翻译方法

    公开(公告)号:CN110472727B

    公开(公告)日:2021-05-11

    申请号:CN201910676598.9

    申请日:2019-07-25

    Abstract: 本发明涉及基于重读和反馈机制的神经机器翻译方法,属于自然语言处理技术领域。首先,第一层编码器的最终状态在传递给第一层解码器进行解码的同时,生成其副本并传递给第二层编码器,第二层编码器重新读取该状态用于参数初始化,该过程称为“重读”。其次,将第一层解码器的解码结果和源语言共同作为重要性计算方法的输入,产生的重要性权重反馈到第二层编码器用于指导编码,该过程称为“反馈”。本发明能够实现端到端神经网络结构的改变,改变后的网络结构能够更好的挖掘全局信息,适用于平行语料稀缺型翻译环境。

    基于案件要素句子关联图卷积的案件舆情摘要生成方法

    公开(公告)号:CN111339754A

    公开(公告)日:2020-06-26

    申请号:CN202010141405.2

    申请日:2020-03-04

    Abstract: 本发明涉及基于案件要素句子关联图卷积的案件舆情摘要生成方法,属于自然语言处理技术领域。本发明融合案件要素和词构建基于案件要素的句子关联图,来表征句子信息和句子之间的关联关系;使用图卷积神经网络学习句子信息和句子之间的关联关系,对句子进行分类,得到每个句子的重要性评分;按重要性对句子进行排序,通过去重和时序关系调整得到摘要。本发明实现了从涉及特定案件的多个新闻文本中,获取重要信息作为其简短摘要。对于相关人员快速掌控舆情态势有着重要的作用,解决了针对案件舆情摘要如何融入领域知识和跨文档句子关联关系的问题。

    基于案件要素及BiGRU的涉案舆情新闻文本摘要方法

    公开(公告)号:CN110489541A

    公开(公告)日:2019-11-22

    申请号:CN201910680097.8

    申请日:2019-07-26

    Abstract: 本发明涉及基于案件要素及BiGRU的涉案舆情新闻文本摘要方法,属于自然语言处理技术领域。本发明首先构建涉案舆情新闻摘要数据集并定义相关案件要素,然后通过注意力机制将案件要素信息融入新闻文本的词、句子双层编码过程中,生成带有案件要素信息的新闻文本表征,最后利用多特征分类层对句子进行分类,得到摘要。本发明实现了从涉及特定案件的舆情新闻文本中,获取重要信息作为其简短摘要。对于相关人员快速掌控舆情态势有着重要的作用。

    融合依存句法信息和卷积神经网络的越南语新闻事件检测方法

    公开(公告)号:CN110377738A

    公开(公告)日:2019-10-25

    申请号:CN201910635489.2

    申请日:2019-07-15

    Abstract: 本发明涉及融合依存句法信息和卷积神经网络的越南语新闻事件检测方法,属于自然语言处理技术领域。本发明首先收集汉越双语新闻文本,根据事件的特征,设置事件类型、用于事件检测的标注体系,形成训练数据。然后融合依存句法信息的卷积神经网络,针对句子级别越南语新闻事件进行检测。首先在编码过程中融合了词义、位置信息、词性信息和命名实体信息。其次利用传统卷积编码连续词之间的特征,利用融合依存句法信息的卷积编码非连续词之间的特征,融合两部分特征作为事件编码,进而实现新闻事件检测。本发明在新闻事件检测中的取得了很好效果。

    基于迁移学习的缅语情感分析方法及装置

    公开(公告)号:CN110334187A

    公开(公告)日:2019-10-15

    申请号:CN201910613176.7

    申请日:2019-07-09

    Abstract: 本发明涉及基于迁移学习的缅语情感分析方法及装置,属于自然语言处理技术领域。本发明首先对缅语词汇进行跨语言word embeddings表示,实现缅语文本到英语文本语义空间的映射;基于CNN和注意力机制的网络预训练英语情感分类模型;通过共享英语情感分类模型的神经网络层参数来学习跨语言情感特征,并迁移到缅语情感分类模型中来实现缅语情感分类;用有标记的缅语数据进行模型调优,最终实现缅语情感分类。并根据上述步骤功能模块化制成基于迁移学习的缅语情感分析装置,本发明对缅语句子实现了有效的情感分析,解决了缅语情感标记数据缺乏造成性能不佳的问题。

Patent Agency Ranking