一种关系表非键属性特征抽取与数据生成方法

    公开(公告)号:CN108920501A

    公开(公告)日:2018-11-30

    申请号:CN201810511653.4

    申请日:2018-05-25

    Applicant: 南开大学

    Abstract: 本发明提供了一种关系表非键属性特征抽取与数据生成方法。该方法可细分为三个处理阶段:特征抽取、特征变换、目标数据集生成。该方法首先对原始数据集进行特征抽取,获取特征空间,对两非键属性间频数的联合分布进行相关性度量排序;然后对抽取自原始数据集的特征空间进行特征变换;最后依照相关性度量系列从特征变换后的特征空间生成目标数据集。本发明提供了两种应用场景:特定数据模式下数据生成场景和预测数据集随时间变化的场景。本发明不但完善了关系表数据生成的研究,而且拓展了数据生成的应用场景。

    一种关系表非键属性特征抽取与数据生成方法

    公开(公告)号:CN108920501B

    公开(公告)日:2021-09-03

    申请号:CN201810511653.4

    申请日:2018-05-25

    Applicant: 南开大学

    Abstract: 本发明提供了一种关系表非键属性特征抽取与数据生成方法。该方法可细分为三个处理阶段:特征抽取、特征变换、目标数据集生成。该方法首先对原始数据集进行特征抽取,获取特征空间,对两非键属性间频数的联合分布进行相关性度量排序;然后对抽取自原始数据集的特征空间进行特征变换;最后依照相关性度量系列从特征变换后的特征空间生成目标数据集。本发明提供了两种应用场景:特定数据模式下数据生成场景和预测数据集随时间变化的场景。本发明不但完善了关系表数据生成的研究,而且拓展了数据生成的应用场景。

Patent Agency Ranking