基于数据集相关性的标签网络产生方法和系统

    公开(公告)号:CN106844407B

    公开(公告)日:2020-03-10

    申请号:CN201510896534.1

    申请日:2015-12-07

    Abstract: 一种基于数据集相关性的标签网络产生方法和系统,以提高标签的使用效率。在本发明一些可行的实施方式中,方法包括:获取标签集合和所述标签集合对应的数据集;从所述数据集中,获取每个标签对应的样本集合;采用统计方法计算任意两个标签分别对应的两个样本集合间的关联系数;在所述两个样本集合间的关联系数满足预设条件时,在所述两个样本集合分别对应的两个标签之间建立连接,产生标签网络。

    一种冲突检验方法以及计算机系统

    公开(公告)号:CN105740358B

    公开(公告)日:2019-04-19

    申请号:CN201610051422.0

    申请日:2016-01-26

    Abstract: 本发明实施例公开了一种冲突检验方法,用于提高计算机系统的冲突检验效率。本发明实施例方法包括:获取第一词语和第二词语;获取概念标识对应表;确定第一词语对应的第一概念标识与第二词语对应的第二概念标识;判断第一概念标识和第二概念标识是否互为反义,若是则确定第一词语和第二词语冲突。本发提供的方法能够大大减少冲突检验过程中的判断次数,节约大量的时间以及计算资源,提高冲突检验效率。本发明还提供了相关的计算机系统。

    基于数据集相关性的标签网络产生方法和系统

    公开(公告)号:CN106844407A

    公开(公告)日:2017-06-13

    申请号:CN201510896534.1

    申请日:2015-12-07

    Abstract: 一种基于数据集相关性的标签网络产生方法和系统,以提高标签的使用效率。在本发明一些可行的实施方式中,方法包括:获取标签集合和所述标签集合对应的数据集;从所述数据集中,获取每个标签对应的样本集合;采用统计方法计算任意两个标签分别对应的两个样本集合间的关联系数;在所述两个样本集合间的关联系数满足预设条件时,在所述两个样本集合分别对应的两个标签之间建立连接,产生标签网络。

    一种冲突检验方法以及计算机系统

    公开(公告)号:CN105740358A

    公开(公告)日:2016-07-06

    申请号:CN201610051422.0

    申请日:2016-01-26

    CPC classification number: G06F17/30864 G06F17/2785 G06F17/2795

    Abstract: 本发明实施例公开了一种冲突检验方法,用于提高计算机系统的冲突检验效率。本发明实施例方法包括:获取第一词语和第二词语;获取概念标识对应表;确定第一词语对应的第一概念标识与第二词语对应的第二概念标识;判断第一概念标识和第二概念标识是否互为反义,若是则确定第一词语和第二词语冲突。本发提供的方法能够大大减少冲突检验过程中的判断次数,节约大量的时间以及计算资源,提高冲突检验效率。本发明还提供了相关的计算机系统。

    一种特征选择方法及设备

    公开(公告)号:CN107656927A

    公开(公告)日:2018-02-02

    申请号:CN201610586886.1

    申请日:2016-07-25

    CPC classification number: G06F17/30598 G06F17/30705 G06F17/30867

    Abstract: 本发明实施例提供一种特征选择方法及设备,其中方法包括如下步骤:获取针对目标事件的样本数据中包含的多个数据特征,计算所述多个数据特征中各数据特征之间的独立性概率;根据所述各数据特征之间的独立性概率,对所述多个数据特征进行聚类处理以生成至少一个特征聚类分组;按照预设特征选择规则从所述至少一个特征聚类分组中选择预设数量的目标数据特征,并将所述预设数量的目标数据特征确定为所述目标事件的数据特征集合。采用本发明,通过对多个特征进行聚类处理,再分别从各个聚类分组中选择目标数据特征,这样能够降低特征选择的计算复杂度,进而提高选择特征的效率。

    标签预测生成方法及装置

    公开(公告)号:CN107644047A

    公开(公告)日:2018-01-30

    申请号:CN201610591081.6

    申请日:2016-07-22

    Abstract: 本发明提供一种标签预测生成方法及装置。该方法包括:选取目标标签,并确定目标标签的历史标签时间序列的起始时间点,目标标签为待预测的标签,确定与目标标签存在因果关系的变量,变量包括标签和/或属性,根据预设的时间序列预测出目标标签在目标时间点的值,预设的时间序列包括目标标签的历史标签时间序列和变量的历史时间序列,或者,预设的时间序列包括变量的历史时间序列,变量的历史时间序列的起始时间点与目标标签的历史标签时间序列的起始时间点相同,目标时间点为当前时间点或当前时间点之后的时间点。从而,可以生成当前时间点的标签,也可以预测未来时间点的标签,使得用户画像具有前瞻性,可以更好地支持营销推荐。

    一种特征选择方法及设备

    公开(公告)号:CN107656927B

    公开(公告)日:2021-04-09

    申请号:CN201610586886.1

    申请日:2016-07-25

    Abstract: 本发明实施例提供一种特征选择方法及设备,其中方法包括如下步骤:获取针对目标事件的样本数据中包含的多个数据特征,计算所述多个数据特征中各数据特征之间的独立性概率;根据所述各数据特征之间的独立性概率,对所述多个数据特征进行聚类处理以生成至少一个特征聚类分组;按照预设特征选择规则从所述至少一个特征聚类分组中选择预设数量的目标数据特征,并将所述预设数量的目标数据特征确定为所述目标事件的数据特征集合。采用本发明,通过对多个特征进行聚类处理,再分别从各个聚类分组中选择目标数据特征,这样能够降低特征选择的计算复杂度,进而提高选择特征的效率。

    标签预测生成方法及装置

    公开(公告)号:CN107644047B

    公开(公告)日:2021-01-15

    申请号:CN201610591081.6

    申请日:2016-07-22

    Abstract: 本发明提供一种标签预测生成方法及装置。该方法包括:选取目标标签,并确定目标标签的历史标签时间序列的起始时间点,目标标签为待预测的标签,确定与目标标签存在因果关系的变量,变量包括标签和/或属性,根据预设的时间序列预测出目标标签在目标时间点的值,预设的时间序列包括目标标签的历史标签时间序列和变量的历史时间序列,或者,预设的时间序列包括变量的历史时间序列,变量的历史时间序列的起始时间点与目标标签的历史标签时间序列的起始时间点相同,目标时间点为当前时间点或当前时间点之后的时间点。从而,可以生成当前时间点的标签,也可以预测未来时间点的标签,使得用户画像具有前瞻性,可以更好地支持营销推荐。

Patent Agency Ranking