数据降维方法、装置、计算机设备和存储介质

    公开(公告)号:CN114840506A

    公开(公告)日:2022-08-02

    申请号:CN202210363550.4

    申请日:2022-04-08

    Abstract: 本申请涉及一种数据降维方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:获取风电功率的多种影响因素以及影响因素数据;根据所述目标季节的影响因素数据,对所述多种影响因素进行多重共线性诊断,在多种影响因素之间存在多重共线性,则根据所述目标季节的影响因素数据、预设影响因素观测数据以及岭参数,计算各所述影响因素的岭回归系数;根据所述岭回归系数与所述岭参数之间的对应关系对各个影响因素进行筛选,剔除所述岭回归系数不满足预设岭回归系数变化条件的影响因素,得到多个目标影响因素。通过采用本方法,可以通过各个影响因素的岭回归系数对多个影响因素进行筛选,在保证数据应用价值的条件下,降低数据冗余性。

    基于搜索的代价敏感超图学习的软件缺陷预测方法及系统

    公开(公告)号:CN108334455A

    公开(公告)日:2018-07-27

    申请号:CN201810178494.0

    申请日:2018-03-05

    Applicant: 清华大学

    Inventor: 高跃 王楠 赵曦滨

    Abstract: 本发明提供了一种基于搜索的代价敏感超图学习的软件缺陷预测方法,所述方法包括:输入原始的训练和测试数据,获得软件模块的特征及相应的软件模块标签;对软件数据进行特征提取,将数据特征转换到新的特征空间;在新的特征空间中,基于测试数据选取与相应测试数据距离最近的训练数据;利用选取的训练数据和测试数据构建超图结构,超图的连接是根据软件模块在转换软件模块特征空间的距离来测算,不断优化错分代价敏感的测试数据总代价,并且优化超图结构;利用学习到的转换向量可以用来计算测试模块是否含有错误。

    一种基于F值优化的网络攻击检测方法与系统

    公开(公告)号:CN109951468B

    公开(公告)日:2020-08-28

    申请号:CN201910183415.X

    申请日:2019-03-12

    Applicant: 清华大学

    Abstract: 本申请公开了一种基于F值优化的网络攻击检测方法与系统,其中,该方法包括:步骤1,根据F值计算模型,计算接收到的网络数据对应的错分代价值,并生成代价值矩阵,其中,网络数据包括已标记网络数据和未标记网络数据;步骤2,根据网络数据,构建网络数据对应的超图;步骤3,根据代价值矩阵和超图,计算网络数据对应的预测类标;步骤4,根据预测类标,检测网络数据中的未标记网络数据。通过本申请中的技术方案,提高了对不平衡数据的检测率,利用F值评价指标对错分代价值进行优化,提高了网络异常数据检测的准确性和可靠性。

    一种基于F值优化的网络攻击检测方法与系统

    公开(公告)号:CN109951468A

    公开(公告)日:2019-06-28

    申请号:CN201910183415.X

    申请日:2019-03-12

    Applicant: 清华大学

    Abstract: 本申请公开了一种基于F值优化的网络攻击检测方法与系统,其中,该方法包括:步骤1,根据F值计算模型,计算接收到的网络数据对应的错分代价值,并生成代价值矩阵,其中,网络数据包括已标记网络数据和未标记网络数据;步骤2,根据网络数据,构建网络数据对应的超图;步骤3,根据代价值矩阵和超图,计算网络数据对应的预测类标;步骤4,根据预测类标,检测网络数据中的未标记网络数据。通过本申请中的技术方案,提高了对不平衡数据的检测率,利用F值评价指标对错分代价值进行优化,提高了网络异常数据检测的准确性和可靠性。

    数据降维方法、装置、计算机设备和存储介质

    公开(公告)号:CN114840506B

    公开(公告)日:2025-03-18

    申请号:CN202210363550.4

    申请日:2022-04-08

    Abstract: 本申请涉及一种数据降维方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:获取风电功率的多种影响因素以及影响因素数据;根据所述目标季节的影响因素数据,对所述多种影响因素进行多重共线性诊断,在多种影响因素之间存在多重共线性,则根据所述目标季节的影响因素数据、预设影响因素观测数据以及岭参数,计算各所述影响因素的岭回归系数;根据所述岭回归系数与所述岭参数之间的对应关系对各个影响因素进行筛选,剔除所述岭回归系数不满足预设岭回归系数变化条件的影响因素,得到多个目标影响因素。通过采用本方法,可以通过各个影响因素的岭回归系数对多个影响因素进行筛选,在保证数据应用价值的条件下,降低数据冗余性。

Patent Agency Ranking