-
公开(公告)号:CN108920501B
公开(公告)日:2021-09-03
申请号:CN201810511653.4
申请日:2018-05-25
Applicant: 南开大学
IPC: G06F16/2458
Abstract: 本发明提供了一种关系表非键属性特征抽取与数据生成方法。该方法可细分为三个处理阶段:特征抽取、特征变换、目标数据集生成。该方法首先对原始数据集进行特征抽取,获取特征空间,对两非键属性间频数的联合分布进行相关性度量排序;然后对抽取自原始数据集的特征空间进行特征变换;最后依照相关性度量系列从特征变换后的特征空间生成目标数据集。本发明提供了两种应用场景:特定数据模式下数据生成场景和预测数据集随时间变化的场景。本发明不但完善了关系表数据生成的研究,而且拓展了数据生成的应用场景。
-
公开(公告)号:CN108920501A
公开(公告)日:2018-11-30
申请号:CN201810511653.4
申请日:2018-05-25
Applicant: 南开大学
IPC: G06F17/30
Abstract: 本发明提供了一种关系表非键属性特征抽取与数据生成方法。该方法可细分为三个处理阶段:特征抽取、特征变换、目标数据集生成。该方法首先对原始数据集进行特征抽取,获取特征空间,对两非键属性间频数的联合分布进行相关性度量排序;然后对抽取自原始数据集的特征空间进行特征变换;最后依照相关性度量系列从特征变换后的特征空间生成目标数据集。本发明提供了两种应用场景:特定数据模式下数据生成场景和预测数据集随时间变化的场景。本发明不但完善了关系表数据生成的研究,而且拓展了数据生成的应用场景。
-
公开(公告)号:CN107193967A
公开(公告)日:2017-09-22
申请号:CN201710376130.9
申请日:2017-05-25
Applicant: 南开大学
IPC: G06F17/30
Abstract: 一种多源异构行业领域大数据处理全链路解决方案。本发明在理解行业领域大数据海量性、多样性、快速性、价值性特点的基础上,根据行业领域管理决策的应用需求,设计与实现了多源异构行业领域大数据处理全链路解决方案。本解决方案首先总结归纳了行业领域大数据处理流程,然后提出了面向行业领域大数据的三层存储架构方案,又提出了面向管理决策的多层次多维度数据分析与知识发现方案,最后搭建了面向行业领域大数据的全链路数据处理平台。
-
-