一种基于MapReduce的约束关系粗糙集规则获取方法

    公开(公告)号:CN104915430B

    公开(公告)日:2018-02-23

    申请号:CN201510331121.9

    申请日:2015-06-15

    Inventor: 王诚 赵振文

    Abstract: 本发明公开了一种基于MapReduce的约束关系粗糙集规则获取方法,主要解决现有串行分类规则获取方法无法处理海量数据的问题。该方法实现步骤是:根据具体业务需求,配置数据分片规则库和条件约束值;建立训练数据集和测试数据集;对数据源进行数据预处理;数据分片;对各数据分片进行Map操作:实施约束关系粗糙集算法,获取上下联合、优势集、上下近似集等;将同一类别的Map结果汇总进行Reduce操作,最终得到分类规则。本发明相较其他利用优势关系粗糙集理论获取分类规则的方法,能够充分利用多属性决策信息系统中的偏好规则,约束概念进一步量化了优势关系,MapReduce方法实现了海量数据中的并行运算,能够大大减少处理海量数据的时间,具有良好的时效性、可扩展性以及较强的实用价值。

    一种基于MapReduce的约束关系粗糙集规则获取方法

    公开(公告)号:CN104915430A

    公开(公告)日:2015-09-16

    申请号:CN201510331121.9

    申请日:2015-06-15

    Inventor: 王诚 赵振文

    Abstract: 本发明公开了一种基于MapReduce的约束关系粗糙集规则获取方法,主要解决现有串行分类规则获取方法无法处理海量数据的问题。该方法实现步骤是:根据具体业务需求,配置数据分片规则库和条件约束值;建立训练数据集和测试数据集;对数据源进行数据预处理;数据分片;对各数据分片进行Map操作:实施约束关系粗糙集算法,获取上下联合、优势集、上下近似集等;将同一类别的Map结果汇总进行Reduce操作,最终得到分类规则。本发明相较其他利用优势关系粗糙集理论获取分类规则的方法,能够充分利用多属性决策信息系统中的偏好规则,约束概念进一步量化了优势关系,MapReduce方法实现了海量数据中的并行运算,能够大大减少处理海量数据的时间,具有良好的时效性、可扩展性以及较强的实用价值。

Patent Agency Ranking