一种基于词向量增强的短文本主题抽取方法

    公开(公告)号:CN109086375B

    公开(公告)日:2021-10-22

    申请号:CN201810816147.6

    申请日:2018-07-24

    Applicant: 武汉大学

    Abstract: 本发明涉及一种基于词向量增强的短文本主题抽取方法,具体涉及了一种新的短文本主题抽取模型,称为CRFTM(Condition Random Field regularized Topic Model)。首先,本发明设计了一种通用的短文本距离衡量方式——基于词向量的平均最小距离,通过将短文本聚合成伪文档来缓解稀疏性问题。其次,CRFTM还利用条件随机场(CRF)正则化模型,对语义相关的词语进行语义强化,使其以更高的概率分配至同一的主题。在新闻数据集上的实验结果表明,本发明的短文本主题抽取方法在主题连贯性指标上优于5种基准主题模型。

    一种基于词向量增强的短文本主题抽取方法

    公开(公告)号:CN109086375A

    公开(公告)日:2018-12-25

    申请号:CN201810816147.6

    申请日:2018-07-24

    Applicant: 武汉大学

    Abstract: 本发明涉及一种基于词向量增强的短文本主题抽取方法,具体涉及了一种新的短文本主题抽取模型,称为CRFTM(Condition Random Field regularized Topic Model)。首先,本发明设计了一种通用的短文本距离衡量方式——基于词向量的平均最小距离,通过将短文本聚合成伪文档来缓解稀疏性问题。其次,CRFTM还利用条件随机场(CRF)正则化模型,对语义相关的词语进行语义强化,使其以更高的概率分配至同一的主题。在新闻数据集上的实验结果表明,本发明的短文本主题抽取方法在主题连贯性指标上优于5种基准主题模型。

    一种主题增强的聊天机器人回复生成方法及装置

    公开(公告)号:CN110069611A

    公开(公告)日:2019-07-30

    申请号:CN201910294250.3

    申请日:2019-04-12

    Applicant: 武汉大学

    Abstract: 本发明提供了一种主题增强的聊天机器人回复生成方法及装置,其中的方法首先对对话文本进行预处理和采样,得到对话训练集;然后利用CNN的对对话文本就进行主题抽取,得到文本主题;再利用文本主题,通过MLP预测回复主题,得到预测回复主题;最后,将对话训练集输入到Seq2Seq生成模型,文本主题和预测回复主题通过Gate引入生成模型辅助生成过程,得到聊天机器人对话回复。本发明可以达到降低高频一般回复的生成概率,使神经对话模型能生成更加连贯、丰富的回复的技术效果。

    一种语义强化主题模型及主题演化分析方法

    公开(公告)号:CN109840324A

    公开(公告)日:2019-06-04

    申请号:CN201910020033.5

    申请日:2019-01-09

    Applicant: 武汉大学

    Abstract: 本发明公开了一种语义强化主题模型及主题演化分析方法,语义强化主题模型通过将条件随机场融入关联主题模型,利用词向量的语义强化特质提高相似词归属到同一主题的概率,并利用下上文相关词剔除噪声,从而有效增强主题抽取的语义连贯性。其次,本发明提出了一种不同主题之间演化关系的构建算法,动态从文本数据流中构建主题并生成主题演化图,实现核心主题和子主题之间的演化分析。在新浪微博数据集上的实验结果表明,本发明的主题抽取方法在主题连贯性指标上优于5种基准主题模型,并能自动生成主题演化图,从而有效挖掘出文本中的主题演化模式。

    一种面向开放域问答的基于机器阅读理解的答案获取方法及系统

    公开(公告)号:CN111324717A

    公开(公告)日:2020-06-23

    申请号:CN202010111750.1

    申请日:2020-02-24

    Applicant: 武汉大学

    Abstract: 本发明公开了一种面向开放域问答的基于机器阅读理解的答案获取方法,采用基于BERT的语义编码模块和信息交互注意力网络,深入地捕获问题和文档的潜在语义表示,有效地提取并融合问题和文档间的信息,捕获问题与文档的全局特征;采用基于Pointer Networks的答案获取模块,将注意力权重作为指针,更加准确地定位所预测答案的起止位置。本发明提出的一种面向开放域问答的基于阅读理解的答案获取方法,在CMRC 2018数据集上进行实证评估。实验结果表明,该发明能够达到开放域问答任务标准水平,并取得了优异的表现。

    一种语义强化主题模型构建方法及主题演化分析方法

    公开(公告)号:CN109840324B

    公开(公告)日:2023-03-24

    申请号:CN201910020033.5

    申请日:2019-01-09

    Applicant: 武汉大学

    Abstract: 本发明公开了一种语义强化主题模型构建方法及主题演化分析方法,语义强化主题模型通过将条件随机场融入关联主题模型,利用词向量的语义强化特质提高相似词归属到同一主题的概率,并利用下上文相关词剔除噪声,从而有效增强主题抽取的语义连贯性。其次,本发明提出了一种不同主题之间演化关系的构建算法,动态从文本数据流中构建主题并生成主题演化图,实现核心主题和子主题之间的演化分析。在新浪微博数据集上的实验结果表明,本发明的主题抽取方法在主题连贯性指标上优于5种基准主题模型,并能自动生成主题演化图,从而有效挖掘出文本中的主题演化模式。

    一种基于喷墨打印的全纤维素分离滤膜的制备方法及应用

    公开(公告)号:CN110960993B

    公开(公告)日:2021-05-04

    申请号:CN201911049358.2

    申请日:2019-10-31

    Applicant: 武汉大学

    Abstract: 本发明公开一种基于喷墨打印的全纤维素分离滤膜的制备方法及应用。该方法是将纳米纤维素晶体悬浮液作为墨水,以商用混合纤维素酯滤膜为基底,通过喷墨打印的方式制备一种全纤维素分离滤膜。该滤膜可以通过调控墨水的打印层数调控其孔径大小、厚度以及水通量。根据滤膜空气中超亲水和水中超疏油的浸润性特点,以及滤膜孔径的尺寸排除作用,可以实现对纳米油水乳液的高效分离。本发明简单易行、成本低、以扩大化并且环境友好。

    一种基于喷墨打印的全纤维素分离滤膜的制备方法及应用

    公开(公告)号:CN110960993A

    公开(公告)日:2020-04-07

    申请号:CN201911049358.2

    申请日:2019-10-31

    Applicant: 武汉大学

    Abstract: 本发明公开一种基于喷墨打印的全纤维素分离滤膜的制备方法及应用。该方法是将纳米纤维素晶体悬浮液作为墨水,以商用混合纤维素酯滤膜为基底,通过喷墨打印的方式制备一种全纤维素分离滤膜。该滤膜可以通过调控墨水的打印层数调控其孔径大小、厚度以及水通量。根据滤膜空气中超亲水和水中超疏油的浸润性特点,以及滤膜孔径的尺寸排除作用,可以实现对纳米油水乳液的高效分离。本发明简单易行、成本低、以扩大化并且环境友好。

    一种面向开放域问答的基于机器阅读理解的答案获取方法及系统

    公开(公告)号:CN111324717B

    公开(公告)日:2023-06-27

    申请号:CN202010111750.1

    申请日:2020-02-24

    Applicant: 武汉大学

    Abstract: 本发明公开了一种面向开放域问答的基于机器阅读理解的答案获取方法,采用基于BERT的语义编码模块和信息交互注意力网络,深入地捕获问题和文档的潜在语义表示,有效地提取并融合问题和文档间的信息,捕获问题与文档的全局特征;采用基于Pointer Networks的答案获取模块,将注意力权重作为指针,更加准确地定位所预测答案的起止位置。本发明提出的一种面向开放域问答的基于阅读理解的答案获取方法,在CMRC 2018数据集上进行实证评估。实验结果表明,该发明能够达到开放域问答任务标准水平,并取得了优异的表现。

Patent Agency Ranking