一种基于段落边界扫描预测与词移距离聚类匹配的答案生成方法及装置

    公开(公告)号:CN111666376B

    公开(公告)日:2023-07-18

    申请号:CN202010434060.X

    申请日:2020-05-21

    Applicant: 武汉大学

    Abstract: 一种基于段落边界扫描预测与词移距离聚类匹配的答案生成方法及装置,其中的装置包含两个基础模块:答案检索模块和个性化描述模板选择模块。在答案检索模块采用基于问答边界预测的开放域答案抽取模型,基于TF‑IDF匹配的搜索组件,抽取与查询相关的文档集合,并结合RNN问答边界预测阅读理解模型,从文档集合中寻找答案实体。在个性化描述模板选择模块采用了基于词移距离聚类匹配的个性化描述生成模型,其主要核心采用词移距离的算法,计算查询与所有人工标注个性化描述模版的中心距离,判断查询文本属于个性化模版的类别,在结合抽取的答案实体和对应的个性化模版给出答案的最终个性化自然语言描述。本发明可以提高其答案生成准确率和多样性。

    一种语义强化主题模型构建方法及主题演化分析方法

    公开(公告)号:CN109840324B

    公开(公告)日:2023-03-24

    申请号:CN201910020033.5

    申请日:2019-01-09

    Applicant: 武汉大学

    Abstract: 本发明公开了一种语义强化主题模型构建方法及主题演化分析方法,语义强化主题模型通过将条件随机场融入关联主题模型,利用词向量的语义强化特质提高相似词归属到同一主题的概率,并利用下上文相关词剔除噪声,从而有效增强主题抽取的语义连贯性。其次,本发明提出了一种不同主题之间演化关系的构建算法,动态从文本数据流中构建主题并生成主题演化图,实现核心主题和子主题之间的演化分析。在新浪微博数据集上的实验结果表明,本发明的主题抽取方法在主题连贯性指标上优于5种基准主题模型,并能自动生成主题演化图,从而有效挖掘出文本中的主题演化模式。

    一种基于词移距离结合词向量的音乐文案生成方法

    公开(公告)号:CN109657212B

    公开(公告)日:2022-04-15

    申请号:CN201811525805.2

    申请日:2018-12-13

    Applicant: 武汉大学

    Abstract: 本发明公开了一种基于词移距离结合词向量的音乐文案生成方法,首先从音乐软件网站爬取歌曲的歌词文本、评论文本;然后对歌词文本、评论文本进行分词处理;接着对分词中得到的词语进一步使用向量化表示,获取词语的向量分布表示;计算歌曲中歌词文本向量与所有评论文本向量之间的词移距离,获得各个歌曲评论文本的词移距离排序;设定词移距离的边界值阈值N,将词移距离小于边界值阈值N的歌曲评论文本按词移距离的大小进行排序,作为筛选后的评论文本;最后将备选的评论文本进行去重处理,删除其中不符合自然语法规则的句子,添加上歌曲的属性信息作为推荐给用户的歌曲音乐文案。本发明生成的音乐文案篇幅较小,提高了人们挑选歌曲的效率。

    一种代码查询模型的生成方法和计算机设备

    公开(公告)号:CN113204679A

    公开(公告)日:2021-08-03

    申请号:CN202110391338.4

    申请日:2021-04-13

    Applicant: 武汉大学

    Inventor: 谢婧 胡刚 袁梦霆

    Abstract: 本发明提供了一种代码查询模型的生成方法和计算机设备,代码查询模型的生成方法包括:在训练集中选取匹配语句对和非匹配语句对;基于初始词嵌入模块匹配词嵌入向量集和非匹配向量集,基于初始Transformer模块确定匹配词嵌入矩阵集以及非匹配词嵌入矩阵集;基于初始交互注意力模块确定第一相似度和第二相似度;基于第一相似度和第二相似度训练得到代码查询模型。本发明通过初始词嵌入模块和初始Transformer模块学习查询语句和代码语句多层面语义信息,使得训练得到的代码查询模型可以在程序代码数据库庞大、结构繁杂时准确匹配查询语句对应的匹配代码语句。

    一种基于词向量的企业所属新兴产业分类方法

    公开(公告)号:CN112686043A

    公开(公告)日:2021-04-20

    申请号:CN202110034145.3

    申请日:2021-01-12

    Applicant: 武汉大学

    Abstract: 本发明提出了一种基于词向量的企业所属新兴产业分类方法。本发明获得输入的新兴产业,根据其名称在互联网上获得相关信息;根据新兴产业相关信息利用Textrank算法,获得其候选关键词;根据候选关键词利用K‑means算法聚类获得新兴产业聚类关键词;从官网获取企业经营范围,根据经营范围得到企业经营词库;根据企业经营词库,扩展新兴产业聚类关键词,得到新兴产业关键词词库;根据企业经营词库,获得词语的逆文档频率权重;根据待分类企业经营范围与新兴产业关键词词库,依次得到基础评估分数、综合评估分数和企业分类分数;根据企业分类分数,得到企业所属新兴产业分类结果。本发明优点在,无需人工标注、无需训练、准确率高,并且可对新增新兴产业分类。

    一种基于分层嵌入的神经代码搜索方法及装置

    公开(公告)号:CN111191002A

    公开(公告)日:2020-05-22

    申请号:CN201911364631.0

    申请日:2019-12-26

    Applicant: 武汉大学

    Inventor: 彭敏 胡刚 黎芮彤

    Abstract: 本发明公开了一种基于分层嵌入的神经代码搜索方法,包括收集代码搜索数据集;对收集的代码搜索数据集进行预处理;对预处理后的语料数据进行结构化分词以及比例划分;构建依次包含内部信息编码模块、交互信息编码模块、相似度匹配模块的分层嵌入神经代码搜索模型HECS,并设置训练网络的合页损失函数;对HECS设置初始化参数,并利用训练集来训练拟合HECS模型的参数,直到在验证集上迭代预设次直到合页损失函数收敛,得到训练好的HECS模型;利用训练好的HECS模型对待处理的查询进行预测,获得与查询对应的代码搜索结果。本发明的方法可以更好地捕获查询与矢量空间中相应代码段之间的相似性,提高模型的搜索和预测性能。

    一种筛选抗褐飞虱水稻的方法及其专用引物

    公开(公告)号:CN102296108B

    公开(公告)日:2012-10-31

    申请号:CN201110170178.7

    申请日:2011-10-12

    Abstract: 一种辅助筛选抗褐飞虱水稻的方法与其专用引物。辅助筛选抗褐飞虱水稻的引物,是由序列表中序列B14F1、B14R1、B14F2和B14R2的核苷酸序列组成的四条引物。该方法是以待检测水稻的基因组DNA为模板,用序列表中序列B14F1、B14R1、B14F2和B14R2的核苷酸序列组成的四条引物进行PCR扩增,如该待测水稻的扩增产物为大小566bp的条带,则该待测水稻为候选抗褐飞虱水稻。该方法可用于选育抗褐飞虱水稻,缩短抗褐飞虱水稻的育种周期,加快育种速度,降低育种成本,具有操作简单,成本低廉,周期短的优点,适应于推广应用,为选育抗褐飞虱水稻品种提供了一种快捷的检测方法。

    一种基于区域产业企业的三网产业图谱构建方法

    公开(公告)号:CN112784057A

    公开(公告)日:2021-05-11

    申请号:CN202110029149.2

    申请日:2021-01-11

    Applicant: 武汉大学

    Abstract: 本发明提出了一种基于区域产业企业的三网产业图谱构建方法。本发明从官方网站获取投入产出信息、产业描述信息、行政区划关系和企业相关属性信息;从新闻网站获取新闻舆情数据;利用共现性和相似度算法分别对企业经营范围和专利信息进行计算,得到企业合作和竞争网络,将企业合作和竞争网络加权得到企业关联网络;根据投入产出表计算产业关联网络;根据行政区划关系计算区域关联网络;利用无监督方法计算企业到产业的映射;根据企业关联网络更新产业关联网络;利用区域关联网络、产业关联网络和企业关联网络形成三网产业图谱。本发明通过舆情信息,动态反应在企业关联网络中,并更新到产业关联网络,帮助决策部门更快捕捉区域产业发展变化。

    一种主题增强的聊天机器人回复生成方法及装置

    公开(公告)号:CN110069611B

    公开(公告)日:2021-05-04

    申请号:CN201910294250.3

    申请日:2019-04-12

    Applicant: 武汉大学

    Abstract: 本发明提供了一种主题增强的聊天机器人回复生成方法及装置,其中的方法首先对对话文本进行预处理和采样,得到对话训练集;然后利用CNN的对对话文本就进行主题抽取,得到文本主题;再利用文本主题,通过MLP预测回复主题,得到预测回复主题;最后,将对话训练集输入到Seq2Seq生成模型,文本主题和预测回复主题通过Gate引入生成模型辅助生成过程,得到聊天机器人对话回复。本发明可以达到降低高频一般回复的生成概率,使神经对话模型能生成更加连贯、丰富的回复的技术效果。

    一种具有儿童健康学习监督功能的智能台灯

    公开(公告)号:CN109858376A

    公开(公告)日:2019-06-07

    申请号:CN201910002456.4

    申请日:2019-01-02

    Applicant: 武汉大学

    Abstract: 本发明公开了一种具有儿童健康学习监督功能的智能台灯,主要以图像识别为基础结合当下流行且应用效果明显的深度学习算法,使用开源的Tensorflow框架结合DeepLab技术来实现对儿童自主学习的监控。同时利用开源硬件树莓派来做内部控制,并以台灯为载体,设计的系统模块包含有图像处理模块、通信模块、前端控制模块、云端数据模块和移动端显示模块五大部分。其中图像处理模块负责图像收集、模型训练、图像识别;通信模块负责蓝牙通信、WIFI通信;前段控制模块负责交互控制和感应自动控制;云端数据模块负责数据存储、数据查询、数据通信;移动端显示模块负责移动端的数据配置和绑定注册。本发明方法结合内置的语音模块,对儿童学习状态进行监控,帮助儿童自主学习。

Patent Agency Ranking