-
-
公开(公告)号:CN112686043B
公开(公告)日:2024-02-06
申请号:CN202110034145.3
申请日:2021-01-12
Applicant: 武汉大学
IPC: G06F40/289 , G06F40/216 , G06F18/23213 , G06F16/951
Abstract: 本发明提出了一种基于词向量的企业所属新兴产业分类方法。本发明获得输入的新兴产业,根据其名称在互联网上获得相关信息;根据新兴产业相关信息利用Textrank算法,获得其候选关键词;根据候选关键词利用K‑means算法聚类获得新兴产业聚类关键词;从官网获取企业经营范围,根据经营范围得到企业经营词库;根据企业经营词库,扩展新兴产业聚类关键词,得到新兴产业关键词词库;根据企业经营词库,获得词语的逆文档频率权重;根据待分类企业经营范围与新兴产业关键词词库,依次得到基础评估分数、综合评估分数和企业分类分数;根据企业分类分数,得到企业所属新兴产业分类结果。本发明优点在,无需人工标注、无需训练、准确率高,并且可对新增新兴产业分类。
-
公开(公告)号:CN111191002B
公开(公告)日:2023-05-23
申请号:CN201911364631.0
申请日:2019-12-26
Applicant: 武汉大学
IPC: G06F16/33 , G06N3/0442 , G06N3/08
Abstract: 本发明公开了一种基于分层嵌入的神经代码搜索方法,包括收集代码搜索数据集;对收集的代码搜索数据集进行预处理;对预处理后的语料数据进行结构化分词以及比例划分;构建依次包含内部信息编码模块、交互信息编码模块、相似度匹配模块的分层嵌入神经代码搜索模型HECS,并设置训练网络的合页损失函数;对HECS设置初始化参数,并利用训练集来训练拟合HECS模型的参数,直到在验证集上迭代预设次直到合页损失函数收敛,得到训练好的HECS模型;利用训练好的HECS模型对待处理的查询进行预测,获得与查询对应的代码搜索结果。本发明的方法可以更好地捕获查询与矢量空间中相应代码段之间的相似性,提高模型的搜索和预测性能。
-
公开(公告)号:CN115130672A
公开(公告)日:2022-09-30
申请号:CN202210642934.X
申请日:2022-06-08
Applicant: 武汉大学
Abstract: 本发明公开了一种软硬件协同优化卷积神经网络计算的方法及装置,针对ShuffleNetV2模型进行模块分析和协同设计,通过实现量化、改进计算单元;针对模型的特点,以可重构计算设备为基础进行优化;实现了8bit的量化,同时重新设计了深度可分离卷积操作,使模块以硬件友好的形式进行运算,并使用HLS(High Level Synthesis)在FPGA平台xilinxzynqxc‑7Z045上完成了上述软硬件协同优化的实验工作。本发明对优化后CNN计算模型在资源利用率和时延方面都有明显的提高。
-
公开(公告)号:CN113392216B
公开(公告)日:2022-06-17
申请号:CN202110699269.3
申请日:2021-06-23
Applicant: 武汉大学
IPC: G06F16/35 , G06F40/216 , G06N3/08 , G06N5/02
Abstract: 本发明提供一种基于一致性文本增强的远程监督关系抽取方法及装置,该方法包括:按实体对和关系标签对多个句子实例进行划分,得到多个句子包;对每个句子包中的每个句子实例采用不同的文本增强方法,得到每个句子包中的每个句子实例对应的强增强样本以及弱增强样本;确定噪声样例,并通过无关系句子实例以及噪声样例的强增强样本和弱增强样本对关系预测模型进行训练,得到训练好的关系预测模型;利用训练好的关系预测模型对待预测的句子包进行预测,获得与其对应的关系标签。通过本发明,通过一致性文本增强,能够增加数据集规模,增强模型的泛化学习能力,让“NA”类别和噪音样例约束模型学习更多的监督信息。
-
公开(公告)号:CN112784057B
公开(公告)日:2022-05-13
申请号:CN202110029149.2
申请日:2021-01-11
Applicant: 武汉大学
Abstract: 本发明提出了一种基于区域产业企业的三网产业图谱构建方法。本发明从官方网站获取投入产出信息、产业描述信息、行政区划关系和企业相关属性信息;从新闻网站获取新闻舆情数据;利用共现性和相似度算法分别对企业经营范围和专利信息进行计算,得到企业合作和竞争网络,将企业合作和竞争网络加权得到企业关联网络;根据投入产出表计算产业关联网络;根据行政区划关系计算区域关联网络;利用无监督方法计算企业到产业的映射;根据企业关联网络更新产业关联网络;利用区域关联网络、产业关联网络和企业关联网络形成三网产业图谱。本发明通过舆情信息,动态反应在企业关联网络中,并更新到产业关联网络,帮助决策部门更快捕捉区域产业发展变化。
-
公开(公告)号:CN113449076A
公开(公告)日:2021-09-28
申请号:CN202110697410.6
申请日:2021-06-23
Applicant: 武汉大学
IPC: G06F16/33 , G06F40/289 , G06K9/62 , G06N3/04
Abstract: 本发明提供一种基于全局信息和局部信息的代码搜索嵌入方法及装置。本发明中设计了一个共享的线性层和卷积层接在ON‑LSTM后面,利用共享的网络参数,能够将“双塔”ON‑LSTM模型输出后的顺序信息融合增强,加强对全局信息的利用;巧妙地应用ON‑LSTM的结构特性,选择其中的结构信息并使用CNN增强,通过曼哈顿距离的计算,加强对局部信息的利用;通过将各个模块输出的交互向量、结构向量、全局信息向量拼接成特征向量,再计算相似度,平衡全局信息和局部信息。
-
公开(公告)号:CN108519890B
公开(公告)日:2021-07-20
申请号:CN201810306806.1
申请日:2018-04-08
Applicant: 武汉大学
Abstract: 本发明公开了一种基于自注意力机制的鲁棒性代码摘要生成方法,首先是编程社区高质量的代码及其描述语料对(查询描述的文本,回复代码的文本)的抽取;然后是代码及其描述语料对的冗余信息滤除;接着将代码对应的查询描述文本转换成陈述性语句;最后是基于自注意力机制序列模型的代码摘要生成。本发明能够有效的去除冗余信息和噪声内容,并且生成的摘要在自动评测和人工评测准确率上均有提高,评测结果优于现有的基线方法。
-
公开(公告)号:CN111324717A
公开(公告)日:2020-06-23
申请号:CN202010111750.1
申请日:2020-02-24
Applicant: 武汉大学
IPC: G06F16/332 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种面向开放域问答的基于机器阅读理解的答案获取方法,采用基于BERT的语义编码模块和信息交互注意力网络,深入地捕获问题和文档的潜在语义表示,有效地提取并融合问题和文档间的信息,捕获问题与文档的全局特征;采用基于Pointer Networks的答案获取模块,将注意力权重作为指针,更加准确地定位所预测答案的起止位置。本发明提出的一种面向开放域问答的基于阅读理解的答案获取方法,在CMRC 2018数据集上进行实证评估。实验结果表明,该发明能够达到开放域问答任务标准水平,并取得了优异的表现。
-
公开(公告)号:CN111159223A
公开(公告)日:2020-05-15
申请号:CN201911420354.0
申请日:2019-12-31
Applicant: 武汉大学
IPC: G06F16/242
Abstract: 本发明提供了一种基于结构化嵌入的交互式代码搜索方法,首先从收集的原始数据中抽取出软件存储库以及代码-描述匹配对的模型语料,然后对代码存储库及模型语料的分词,接着采用预设工具构建预训练的结构化嵌入;接下来抽取高质量模型语料并划分;然后构建依次包含特征抽取模块、交互注意力抽取模块和相似度匹配模块的交互式代码搜索模型NICS,并设置训练网络的合页损失函数;再将预训练结构化词嵌入加载至交互式代码搜索NICS模型,并对NICS模型进行训练,最后利用训练好的NICS模型对待处理的查询进行预测,获得与查询对应的代码搜索结果。本发明可以有效地检索代码片段,并在所有基准测试中取得最先进的性能。
-
-
-
-
-
-
-
-
-