一种面向软件缺陷预测的混合特征选择方法

    公开(公告)号:CN107391365A

    公开(公告)日:2017-11-24

    申请号:CN201710547660.5

    申请日:2017-07-06

    Applicant: 武汉大学

    Abstract: 本发明涉及一种面向软件缺陷预测的混合特征选择方法,首先从原始特征集中选择最相关的m个特征,丢弃掉不相关特征;随后根据特征与特征之间的关联性,对这m个特征进行聚类,将相互之间冗余度高的特征聚类到同一个簇中。最后利用包裹式特征选择的思想,从当前特征子集中删除每个簇中一个最不相关的特征,形成新的特征子集,然后用准确率这个评价函数对该特征子集进行评价,本发明得到的最终特征子集既排除了不相关特征,又降低了特征之间的冗余度。同时,从不同簇里删除一个最不相关的特征形成新的特征子集,可以有效减少被搜索的特征子集的数量。

    一种基于异构信息网络的电影推荐方法

    公开(公告)号:CN106709037A

    公开(公告)日:2017-05-24

    申请号:CN201611248620.2

    申请日:2016-12-29

    Applicant: 武汉大学

    Abstract: 一种基于异构信息网络的电影推荐方法,包括链接建模,以用户、电影、电影类型三种类型的对象为结点构建用户‑电影异构网络,以电影类型结点为中心,对异构网络进行社团划分,筛选出符合要求的社团,提高其运算速度和效率,利用异构网络中的元路径,计算目标用户与社团中的每个用户之间的影响力,计算目标用户与电影类型的喜爱程度,特征建模,分析目标用户的每一个特征被划分到每种电影类型的概率,综合计算目标用户对每个电影类型的喜爱程度,对链接建模和特征建模的结果进行加权求和,分析目标用户对每一种电影类型的喜爱程度,按照目标用户对每一种电影类型的喜爱程度,选择电影类型,推荐评分高的电影。

    一种基于结构化词嵌入网络的智能合约代码缺陷检测方法

    公开(公告)号:CN112416358A

    公开(公告)日:2021-02-26

    申请号:CN202011310395.7

    申请日:2020-11-20

    Applicant: 武汉大学

    Abstract: 本发明涉及一种基于结构化词嵌入网络的智能合约代码缺陷检测方法,具体是构建合约代码抽象语法树以及单词序列化模块,将收集到的合约代码转化为单词序列作为训练集。然后利用合约语法分析工具判定代码是否存在缺陷以及缺陷的数量,作为训练集的标签数据。再由单词序列训练得到词嵌入矩阵,将词嵌入矩阵作为循环神经网络的词嵌入层,构建GRU网络。使用训练集以及标签对网络进行训练。最后将新的智能合约代码经过单词序列化后输入到训练好的GRU网络中,输出缺陷判别的结果,是一种合约代码检测的方法。本发明使结构化的合约代码高效的序列化,提高代码缺陷检测的准确度以及自适应能力。

    一种基于贝叶斯网络推理的软件错误分层诊断方法

    公开(公告)号:CN107025169B

    公开(公告)日:2020-08-21

    申请号:CN201710048225.8

    申请日:2017-01-20

    Applicant: 武汉大学

    Abstract: 本发明涉及一种基于贝叶斯网络推理的软件错误分层诊断方法,包括构建函数层,MIC理论的应用,提高统计依赖的准确度,改进并应用Laplace平滑策略,解决测试数据稀松性。进行测试预言,判断某测试用例对整个程序是否为失败测试用例。进行错误定位,计算函数的可疑度并排序,构建对应函数的语句层BNPDG,按可疑度排序对函数进行逐一检查,在函数的语句层BNPDG上进行测试预言,找到bug函数,在其语句层BNPDG上进行错误定位,得到函数中所有语句的可疑度排序。按照可疑度排序对语句进行逐一检查,直到找到bug语句。本发明减少了错误诊断的空间消耗和时间消耗。解决了RankCP等技术中计算的局部可疑度存在的问题。

    一种面向软件缺陷个数预测的特征选择方法

    公开(公告)号:CN107239798B

    公开(公告)日:2020-06-09

    申请号:CN201710374939.8

    申请日:2017-05-24

    Applicant: 武汉大学

    Abstract: 本发明针对软件缺陷数据集中不相关特征和冗余特征会降低软件缺陷个数预测模型的性能的问题,提出了一种面向软件缺陷个数预测的特征选择方法。首先利用特征与特征之间的关联性,对特征集进行谱聚类,将相互之间冗余度高的特征聚类到同一个簇中。在聚类的结果中,利用特征与软件缺陷个数之间的相关性,从每个簇中选出相关性最强的几个特征,这样既降低了特征之间的冗余度,又排除了不相关特征,得到最终的有益于缺陷个数预测模型性能的特征子集。本发明的技术方案具有简单、快速的特点,得到的特征子集有助于提高软件缺陷个数预测模型的性能。

    一种基于核主成分分析和极限学习机的软件缺陷预测方法

    公开(公告)号:CN107346286B

    公开(公告)日:2020-05-12

    申请号:CN201710533417.8

    申请日:2017-07-03

    Applicant: 武汉大学

    Abstract: 本发明公开了一种基于核主成分分析和极限学习机的软件缺陷预测方法,针对软件缺陷个数的预测中不相关的模块特征损害了缺陷预测模型性能,原始特征可能无法正确表示原始缺陷数据的问题,首先采用核主成分分析,通过非线性映射将原始数据投影到潜在特征空间中,使得映射的特征可以正确表征复杂数据结构、增加空间内数据的线性可分离性的概率,然后提取数据的代表性特征,最后根据特征提取后的数据,采用极限学习机构建缺陷预测模型。

    一种基于数据筛选和数据过采样的跨项目缺陷预测方法

    公开(公告)号:CN107391369B

    公开(公告)日:2020-03-24

    申请号:CN201710571098.X

    申请日:2017-07-13

    Applicant: 武汉大学

    Abstract: 本发明公开了一种基于数据筛选和数据过采样的跨项目缺陷预测方法,设计了合理的数据筛选和数据不平衡处理策略,利用层次聚类算法筛选出真正和本项目模块数据相似的跨项目历史软件模块数据,使跨项目软件缺陷预测模型避免受到不相关跨项目历史软件模块数据的影响,然后利用过采样方法增加有缺陷的软件模块数据得到分类相对平衡的新数据集,使跨项目软件缺陷预测模型避免受到不平衡的训练数据集的影响。本发明的技术方案具有简单高效的特点,能够较好地提高跨项目软件缺陷预测模型的性能。

    一种基于数据欠采样和集成学习的软件缺陷数目预测方法

    公开(公告)号:CN107391452B

    公开(公告)日:2020-01-07

    申请号:CN201710548391.4

    申请日:2017-07-06

    Applicant: 武汉大学

    Abstract: 本发明针对软件缺陷数据集中数据极度不平衡会降低软件缺陷数目预测模型的性能的问题,提出了一种基于数据欠采样和集成学习的软件缺陷数目预测方法。本发明设计了合理的不平衡数据处理策略,首先利用随机欠采样技术通过删除缺陷数据集中缺陷数目为零的软件模块得到相对平衡的新数据集,然后利用相对平衡的缺陷数据集训练出若干个弱的软件缺陷数目预测模型,最后集成这些弱的软件缺陷数目预测模型来预测待预测的软件模块的缺陷数目。本发明的技术方案既能够解决缺陷数据集中数据不平衡的问题,又能够结合多个弱的预测模型来提高软件缺陷数目预测模型的性能。

    一种基于Spark平台的并行序列模式挖掘方法

    公开(公告)号:CN107145548B

    公开(公告)日:2019-08-20

    申请号:CN201710284017.8

    申请日:2017-04-26

    Applicant: 武汉大学

    Abstract: 本发明公开了一种基于Spark平台的并行序列模式挖掘方法,针对现有的串行化序列模式挖掘算法在处理海量数据时计算能力低效的问题和现有的基于Hadoop的并行序列模式挖掘算法具有高IO开销和负载不平衡的问题,设计了合理的序列数据库分解策略,最大限度的解决了负载不平衡的问题。在此基础上根据MapReduce编程框架的特性,对原始GSP算法进行了并行化,利用Spark云计算平台的大规模并行计算能力提高了海量数据序列模式挖掘效率。

    一种基于卷积神经网络的商品评论数据情感分类方法

    公开(公告)号:CN107391483A

    公开(公告)日:2017-11-24

    申请号:CN201710572175.3

    申请日:2017-07-13

    Applicant: 武汉大学

    Abstract: 本发明公开了一种基于卷积神经网络的商品评论数据情感分类方法,针对传统的词向量表示方法只提取词汇特征和句法特征,而忽略了词语之间的语义关系的问题,传统的分类算法分类效果能以再被提升的问题,提出了一个基于卷积神经网络的商品评论数据情感分类方法。首先利用CBOW模型提取出每条评论数据的词向量特征,增强了词语之间的语义关系和词向量特征的表达能力,然后利用卷积神经网络模型这个深度学习网络模型建立情感分类模型,提升了评论数据的情感分类性能。本发明的技术方案具有简单、快速的特点,能够较好地提高评论数据情感分类的分类性能。

Patent Agency Ranking