一种基于模糊集特征熵值计算的特征选择方法

    公开(公告)号:CN110689074A

    公开(公告)日:2020-01-14

    申请号:CN201910914920.7

    申请日:2019-09-26

    Abstract: 本发明属于安全数据分析领域,具体涉及一种基于模糊集特征熵值计算的特征选择方法。本发明主要包括计算理想矢量矩阵、计算相似度矩阵、计算特征的熵、计算缩放因子SFi,d、计算特征熵值排名SEd等步骤,本发明使用特征的缩放因子和特定类别之间的熵值来计算每个类别中理想矢量之间的距离,可以优化特征选择,降低计算复杂度。本发明方法采用模糊集中信息熵的计算方法FIEE来解决传统信息增益、信息增益比计算方法中,由于特征取值空间庞大而导致的无法计算的问题。本发明方法可以大大的减小计算复杂度。

    一种有监督判别流形学习的Netflow数据降维方法

    公开(公告)号:CN110490231A

    公开(公告)日:2019-11-22

    申请号:CN201910644369.9

    申请日:2019-07-17

    Abstract: 本发明属于数据处理领域,公开一种有监督判别流形学习的Netflow数据降维方法,步骤(1):获取来自局域网路由器的Netflow数据包并存入数据库;步骤(2):建立Netflow数据矩阵X=[y1,y2,...,yn];步骤(3):建立近邻矩阵Hij,结合近邻矩阵Hij的近邻关系,构造有监督判别矩阵Sij;步骤(4):计算局部散度矩阵SL与全局散度矩阵SN;建立约束目标函数模型J(A),利用约束目标函数模型J(A)寻找一个同时具有最大全局散度矩阵和最小局部散度矩阵的低维投影子空间;步骤(5):特征分解:根据约束目标函数模型J(A),特征分解求得约束目标函数的解,并取前r个特征值所对应的的特征向量组成线性投影矩阵得到高维网络数据在低维空间的投影。本发明有效降低了输入样本的维度,降低Netflow数据量的大小减小了运算量。

Patent Agency Ranking