一种基于核主成分分析和极限学习机的软件缺陷预测方法

    公开(公告)号:CN107346286A

    公开(公告)日:2017-11-14

    申请号:CN201710533417.8

    申请日:2017-07-03

    Applicant: 武汉大学

    Abstract: 本发明公开了一种基于核主成分分析和极限学习机的软件缺陷预测方法,针对软件缺陷个数的预测中不相关的模块特征损害了缺陷预测模型性能,原始特征可能无法正确表示原始缺陷数据的问题,首先采用核主成分分析,通过非线性映射将原始数据投影到潜在特征空间中,使得映射的特征可以正确表征复杂数据结构、增加空间内数据的线性可分离性的概率,然后提取数据的代表性特征,最后根据特征提取后的数据,采用极限学习机构建缺陷预测模型。

    一种基于特征选择和集成学习的软件缺陷个数预测方法

    公开(公告)号:CN107247666A

    公开(公告)日:2017-10-13

    申请号:CN201710375644.2

    申请日:2017-05-24

    Applicant: 武汉大学

    Abstract: 本发明属于软件缺陷预测技术领域,特别是涉及一种基于特征选择和集成学习的软件缺陷个数预测方法,针对软件缺陷个数的预测中不相关的模块特征损害了缺陷预测模型性能,回归模型均具有不同的预测能力,无法选择最佳回归算法等问题,首先利用基于包裹式的特征选择方法过滤不相关和冗余的特征,然后采用六种不同的回归算法:线性回归、岭回归、决策树回归、梯度boosting回归、最近邻回归和多层感知器回归,采用集成学习技术,根据特征筛选后的数据实例,构建综合回归模型。相比于单个的回归模型,本发明提高了软件缺陷个数预测的准确性。

    一种基于三点定位法的推送信息采信检测方法

    公开(公告)号:CN107203592A

    公开(公告)日:2017-09-26

    申请号:CN201710277470.6

    申请日:2017-04-25

    Applicant: 武汉大学

    Abstract: 本发明涉及一种基于三点定位法的推送信息采信检测方法,利用主观消息中的位置信息这个客观因素作为评价参考,无添加新的评价标准,有效降低检验过程的复杂度,应用三点定位法,通过智能手机中的电子地图的定位功能辅助,依据几何扫描算法给出了一个重要的距离计算算法,初步判定信息提供者所在区域范围,并将其与信息发生区域进行比对,粗粒度地检验出可靠的时效信息。

    基于迁移学习和缺陷数量信息的跨公司软件缺陷预测方法

    公开(公告)号:CN107025503A

    公开(公告)日:2017-08-08

    申请号:CN201710253504.8

    申请日:2017-04-18

    Applicant: 武汉大学

    CPC classification number: G06Q10/04 G06Q10/0639

    Abstract: 本发明公开了一种基于迁移学习和缺陷数量信息的跨公司软件缺陷预测方法,包括标注每个跨项目实例即训练数据有多少个缺陷、根据经验提取实例内的度量属性、数据预处理、基于加权跨项目实例集构建贝叶斯缺陷预测模型、根据贝叶斯缺陷预测模型预测本项目实例是否有缺陷等五步骤;本发明对现有跨项目缺陷数据的权值计算方法进行改进,提出一种基于迁移学习和缺陷数量信息的跨公司软件缺陷预测方法,即在根据迁移学习计算权值的基础上,考虑缺陷个数信息的加成作用,有效避免了不平衡问题对预测结果造成的影响,从而提高了跨项目缺陷预测的精度。

    一种基于结构化词嵌入网络的智能合约代码缺陷检测方法

    公开(公告)号:CN112416358B

    公开(公告)日:2022-04-29

    申请号:CN202011310395.7

    申请日:2020-11-20

    Applicant: 武汉大学

    Abstract: 本发明涉及一种基于结构化词嵌入网络的智能合约代码缺陷检测方法,具体是构建合约代码抽象语法树以及单词序列化模块,将收集到的合约代码转化为单词序列作为训练集。然后利用合约语法分析工具判定代码是否存在缺陷以及缺陷的数量,作为训练集的标签数据。再由单词序列训练得到词嵌入矩阵,将词嵌入矩阵作为循环神经网络的词嵌入层,构建GRU网络。使用训练集以及标签对网络进行训练。最后将新的智能合约代码经过单词序列化后输入到训练好的GRU网络中,输出缺陷判别的结果,是一种合约代码检测的方法。本发明使结构化的合约代码高效的序列化,提高代码缺陷检测的准确度以及自适应能力。

    一种基于生成式对抗网络的自动摘要的生成方法及装置

    公开(公告)号:CN109614480B

    公开(公告)日:2020-10-30

    申请号:CN201811417886.4

    申请日:2018-11-26

    Applicant: 武汉大学

    Abstract: 本发明提供了一种基于生成式对抗网络的自动摘要的生成方法及装置,其中的方法首先从问答社区上获取问题数据,并用脚本对数据进行清洗,划分训练集和测试集,建立词典并利用词典生成训练集句向量;再用生成式对抗网络模型对训练集中的句向量进行训练以得到合适的模型参数;最后利用训练得到的模型对测试集进行相似问题答案的自动摘要生成。实现了无监督的学习方式获取数据集以及提高自动摘要的生成效果的技术效果。

    一种面向软件缺陷预测的混合特征选择方法

    公开(公告)号:CN107391365B

    公开(公告)日:2020-10-13

    申请号:CN201710547660.5

    申请日:2017-07-06

    Applicant: 武汉大学

    Abstract: 本发明涉及一种面向软件缺陷预测的混合特征选择方法,首先从原始特征集中选择最相关的m个特征,丢弃掉不相关特征;随后根据特征与特征之间的关联性,对这m个特征进行聚类,将相互之间冗余度高的特征聚类到同一个簇中。最后利用包裹式特征选择的思想,从当前特征子集中删除每个簇中一个最不相关的特征,形成新的特征子集,然后用准确率这个评价函数对该特征子集进行评价,本发明得到的最终特征子集既排除了不相关特征,又降低了特征之间的冗余度。同时,从不同簇里删除一个最不相关的特征形成新的特征子集,可以有效减少被搜索的特征子集的数量。

    一种基于异构信息网络的电影推荐方法

    公开(公告)号:CN106709037B

    公开(公告)日:2019-11-08

    申请号:CN201611248620.2

    申请日:2016-12-29

    Applicant: 武汉大学

    Abstract: 一种基于异构信息网络的电影推荐方法,包括链接建模,以用户、电影、电影类型三种类型的对象为结点构建用户‑电影异构网络,以电影类型结点为中心,对异构网络进行社团划分,筛选出符合要求的社团,提高其运算速度和效率,利用异构网络中的元路径,计算目标用户与社团中的每个用户之间的影响力,计算目标用户与电影类型的喜爱程度,特征建模,分析目标用户的每一个特征被划分到每种电影类型的概率,综合计算目标用户对每个电影类型的喜爱程度,对链接建模和特征建模的结果进行加权求和,分析目标用户对每一种电影类型的喜爱程度,按照目标用户对每一种电影类型的喜爱程度,选择电影类型,推荐评分高的电影。

    一种基于注意力机制的图像-文本数据融合方法和系统

    公开(公告)号:CN109785409A

    公开(公告)日:2019-05-21

    申请号:CN201811644583.6

    申请日:2018-12-29

    Applicant: 武汉大学

    Abstract: 本发明公开了一种基于注意力机制的图像-文本数据融合方法和系统,该方法首先构建基于注意力机制的图像-文本数据融合网络,并基于特定任务构建完整的训练网络,再利用训练集进行训练,然后将待融合的图像和文本数据输入训练好的数据融合网络中,实现两者的数据融合。具有如下突出的特点和优点:第一,引入位置编码代替循环神经网络对文本上下文进行建模,数据融合网络的可并行化程度更高,训练模型的训练速率更快;第二,通过图像和文本在语义层次上的融合,使得融合后的数据质量更高,可用性更强;第三,该方法可以通过多种任务训练数据融合网络,鲁棒性更强。

    一种基于Spark云计算平台的并行序列模式挖掘方法

    公开(公告)号:CN107346331A

    公开(公告)日:2017-11-14

    申请号:CN201710482965.2

    申请日:2017-06-22

    Applicant: 武汉大学

    Abstract: 本发明公开了一种基于Spark云计算平台的并行序列模式挖掘方法,针对现有的串行化序列模式挖掘算法在处理海量数据时计算能力低效的问题和现有的基于Hadoop的并行序列模式挖掘算法具有高IO开销和负载不平衡的问题,设计了合理的投影序列数据库切分策略,最大限度的解决了负载不平衡的问题。在此基础上根据MapReduce编程框架的特性,对原始PrefixSpan算法进行了并行化,利用Spark云计算平台的大规模并行计算能力提高了海量数据序列模式挖掘效率。本发明的技术方案具有简单、快速的特点,能够较好地提高序列模式挖掘的效率。

Patent Agency Ranking