一种关系表非键属性特征抽取与数据生成方法

    公开(公告)号:CN108920501B

    公开(公告)日:2021-09-03

    申请号:CN201810511653.4

    申请日:2018-05-25

    Applicant: 南开大学

    Abstract: 本发明提供了一种关系表非键属性特征抽取与数据生成方法。该方法可细分为三个处理阶段:特征抽取、特征变换、目标数据集生成。该方法首先对原始数据集进行特征抽取,获取特征空间,对两非键属性间频数的联合分布进行相关性度量排序;然后对抽取自原始数据集的特征空间进行特征变换;最后依照相关性度量系列从特征变换后的特征空间生成目标数据集。本发明提供了两种应用场景:特定数据模式下数据生成场景和预测数据集随时间变化的场景。本发明不但完善了关系表数据生成的研究,而且拓展了数据生成的应用场景。

    一种关系表非键属性特征抽取与数据生成方法

    公开(公告)号:CN108920501A

    公开(公告)日:2018-11-30

    申请号:CN201810511653.4

    申请日:2018-05-25

    Applicant: 南开大学

    Abstract: 本发明提供了一种关系表非键属性特征抽取与数据生成方法。该方法可细分为三个处理阶段:特征抽取、特征变换、目标数据集生成。该方法首先对原始数据集进行特征抽取,获取特征空间,对两非键属性间频数的联合分布进行相关性度量排序;然后对抽取自原始数据集的特征空间进行特征变换;最后依照相关性度量系列从特征变换后的特征空间生成目标数据集。本发明提供了两种应用场景:特定数据模式下数据生成场景和预测数据集随时间变化的场景。本发明不但完善了关系表数据生成的研究,而且拓展了数据生成的应用场景。

    一种多源异构行业领域大数据处理全链路解决方案

    公开(公告)号:CN107193967A

    公开(公告)日:2017-09-22

    申请号:CN201710376130.9

    申请日:2017-05-25

    Applicant: 南开大学

    Abstract: 一种多源异构行业领域大数据处理全链路解决方案。本发明在理解行业领域大数据海量性、多样性、快速性、价值性特点的基础上,根据行业领域管理决策的应用需求,设计与实现了多源异构行业领域大数据处理全链路解决方案。本解决方案首先总结归纳了行业领域大数据处理流程,然后提出了面向行业领域大数据的三层存储架构方案,又提出了面向管理决策的多层次多维度数据分析与知识发现方案,最后搭建了面向行业领域大数据的全链路数据处理平台。

Patent Agency Ranking