-
公开(公告)号:CN107870939A
公开(公告)日:2018-04-03
申请号:CN201610856770.5
申请日:2016-09-27
Applicant: 腾讯科技(深圳)有限公司 , 哈尔滨工业大学深圳研究生院
IPC: G06F17/30
CPC classification number: G06F17/30539
Abstract: 本申请公开了一种模式挖掘方法及装置,针对获取的候选模式集合,计算其在各事务中的效用值,对于效用值小于设定的效用阀值的事务进行删除,该部分事务的模式效用值过小,删除后可以减少挖掘计算时间,并根据删除后剩余的目标事务的时间属性,确定候选模式的周期值,在该周期值小于等于设定的周期阀值时,将候选模式确定为挖掘结果,保证了挖掘得到的模式的效用值在时间上分布均匀,更加便于精确决策。
-
公开(公告)号:CN107870936A
公开(公告)日:2018-04-03
申请号:CN201610854714.8
申请日:2016-09-27
Applicant: 腾讯科技(深圳)有限公司 , 哈尔滨工业大学深圳研究生院
IPC: G06F17/30
CPC classification number: G06F17/30522 , G06F2216/03
Abstract: 本发明实施例提供一种数据项相关的高效用项集挖掘方法、装置及数据处理设备,该方法包括:确定待处理项集在事务数据库中的支持度,及所述待处理项集的各数据项在所述事务数据库中的支持度;根据所述待处理项集在事务数据库中的支持度,及所述待处理项集的各数据项在所述事务数据库中的支持度,确定所述待处理项集的项集相关度;确定所述待处理项集的项集效用值;若所述待处理项集的项集效用值不小于设定的最低效用阈值,且所述待处理项集的项集相关度不小于预定的最低相关度阈值,则确定所述待处理项集为数据项相关的高效用项集。本发明实施例可实现数据项相关的高效用项集的挖掘,提升高效用项集的挖掘结果的精准性。
-
公开(公告)号:CN107870913A
公开(公告)日:2018-04-03
申请号:CN201610847309.3
申请日:2016-09-23
Applicant: 腾讯科技(深圳)有限公司 , 哈尔滨工业大学深圳研究生院
IPC: G06F17/30
CPC classification number: G06F17/30 , G06F17/30539
Abstract: 本发明实施例提供一种有效时间的高期望权重项集挖掘方法、装置及处理设备,该方法包括:确定待处理项集所对应的至少一个目标事务;确定所述待处理项集在不确定数据库中的时间有效值;确定所述待处理项集的期望支持度;将所述待处理项集的期望支持度,和所述待处理项集的项集权重值相乘,确定所述待处理项集的期望权重支持度;如果所述待处理项集在不确定数据库中的时间有效值不小于,预定义的最低时间有效阈值,且所述待处理项集的期望权重支持度,不小于,预定义的最低期望权重阈值和不确定数据库中事务总数的乘积,则确定所述待处理项集为有效时间的高期望权重项集。本发明实施例实现了不确定数据库中有效时间的高期望权重项集的挖掘。
-
公开(公告)号:CN106033424A
公开(公告)日:2016-10-19
申请号:CN201510106336.0
申请日:2015-03-11
Applicant: 哈尔滨工业大学深圳研究生院 , 深圳市腾讯计算机系统有限公司
IPC: G06F17/30
Abstract: 本发明公开了一种数据挖掘方法和装置,属于数据挖掘领域。方法包括:扫描事务数据库,得到多个事务以及至少一个项目;获取多个候选项集;对于每个候选项集,根据候选项集中每个项目的权重以及包括候选项集的指定事务的数目,计算候选项集的加权支持度;根据每个指定事务的发生时间,计算候选项集的时效值;判断候选项集的时效值是否大于第一阈值,以及加权支持度是否大于第二阈值;当时效值大于第一阈值且加权支持度大于第二阈值时,将候选项集确定为近期高权重频繁项集。本发明考虑到项集的时效性因素,降低了出现干扰的可能性,且挖掘出的近期高权重频繁项集中的项目之间的关联规则可以准确体现近期的关联规则,提高了准确性和实用性。
-
公开(公告)号:CN108009180B
公开(公告)日:2021-09-21
申请号:CN201610969804.1
申请日:2016-10-28
Applicant: 哈尔滨工业大学深圳研究生院 , 腾讯科技(深圳)有限公司
IPC: G06F16/2458
Abstract: 本发明实施例提供的高质量模式项集挖掘方法包括:确定待处理项集在事务数据库中的支持度以及所述待处理项集的权重占有度;若所述待处理项集在事物数据库中的支持度不小于预定的最低支持度阈值与所述事务数据库中总事务数量的乘积,且所述待处理项集的权重占有度不小于预定的最小权重占有阈值,则确定所述待处理项集为高质量模式项集。本发明实施例可实现数据项相关的高质量模式项集的挖掘,提升高质量模式项集的挖掘结果的精准性。
-
公开(公告)号:CN109766367B
公开(公告)日:2021-06-08
申请号:CN201710629638.5
申请日:2017-07-28
Applicant: 腾讯科技(深圳)有限公司 , 哈尔滨工业大学深圳研究生院
IPC: G06F16/2458 , G06F16/901
Abstract: 一种热点事件确定方法、装置、设备及存储介质,一个实施例的方法包括:获取历史事件数据库中的各事件序列,任意一个事件序列包括各事件及各事件的发生次数;对任意一个事件序列,根据该事件序列中的各事件的发生次数,确定该事件序列中的各事件的事件价值参数值;还确定该事件序列中的各事件在该事件序列中的事件近期有效性参数值;对任意一个事件,根据该事件在各事件序列中的事件价值参数值,确定该事件的事件价值参数总值,并根据该事件在各事件序列中的事件近期有效性参数值,确定该事件的事件近期有效性总值;根据各事件的事件价值参数总值和事件近期有效性总值确定热点事件。本实施例提高了热点事件预测的准确性和性能。
-
公开(公告)号:CN106445975B
公开(公告)日:2020-04-21
申请号:CN201510493081.8
申请日:2015-08-12
Applicant: 哈尔滨工业大学深圳研究生院 , 腾讯科技(深圳)有限公司
IPC: G06F16/22 , G06F16/2458 , G06Q30/02
Abstract: 本发明公开了一种项集挖掘方法及装置,属于数据挖掘领域。所述方法包括:获取自定义的多重最低效用阈值MMU表;MMU表中包括数据库D中各个数据项与最低效用阈值的对应关系;计算数据库D中项集的项集效用值;根据MMU表,计算数据库D中各个项集各自对应的项集最低效用阈值MIU;项集中包含至少一个数据项;当项集效用值≥MIU时,将该项集确定为高效用项集HUI。本发明解决了现有的基于HUIM的算法中,都是将项集的项集效用值是否大于唯一的最低效用阈值作为衡量标准,导致挖掘出的HUI不准确的问题,达到了根据不同项集制定不同的HUI衡量标准,从而提高挖掘出的HUI准确性的效果。
-
公开(公告)号:CN106033447B
公开(公告)日:2020-04-21
申请号:CN201510115234.5
申请日:2015-03-16
Applicant: 哈尔滨工业大学深圳研究生院 , 深圳市腾讯计算机系统有限公司
IPC: G06F16/2458
Abstract: 本发明公开了一种项集挖掘方法及装置,属于数据挖掘领域。所述方法包括:获取自定义的最小期望支持度μ和最低效用比例ε;计算不确定性数据库D中项集的实际期望支持度expSup和实际效用值u,该项集中包含至少一个数据项;当expSup≥|D|*μ,且u≥总效用值TU*ε时,确定该项集为高概率且高效用项集;TU表示不确定性数据库D中所有数据项的效用之和;|D|表示不确定性数据库D中包含的事务总数。本发明达到了挖掘出的项集效用值较高,且发生概率较大,从而保证挖掘出的项集具有较高的实际使用价值的效果。
-
公开(公告)号:CN106033472B
公开(公告)日:2019-08-27
申请号:CN201510126268.4
申请日:2015-03-20
Applicant: 哈尔滨工业大学深圳研究生院 , 深圳市腾讯计算机系统有限公司
IPC: G06F16/2458 , G06F16/28 , G06Q30/02
Abstract: 本发明公开了一种挖掘物品信息的方法及装置,属于计算机及通信领域。所述方法包括:从第一数据库中获取发生修改的第一转移记录以及从第二数据库中获取所述第一转移记录对应的第二转移记录,所述第二数据库是所述第一数据库修改前的数据库;获取所述第一转移记录中包括的各物品和所述第二转移记录中包括的各物品;根据获取的每个物品的第一事务加权效用值,所述第一转移记录和所述第二转移记录,计算所述每个物品的第二事务加权效用值,物品的第一事务加权效用值是根据所述第二数据库计算得到的;从所述每个物品中选择第二事务加权效用值满足预设条件的物品的物品信息。本发明能够提高基于数据库发生修改操作环境下的挖掘物品信息的效率。
-
公开(公告)号:CN109766367A
公开(公告)日:2019-05-17
申请号:CN201710629638.5
申请日:2017-07-28
Applicant: 腾讯科技(深圳)有限公司 , 哈尔滨工业大学深圳研究生院
IPC: G06F16/2458 , G06F16/901
Abstract: 一种热点事件确定方法、装置、设备及存储介质,一个实施例的方法包括:获取历史事件数据库中的各事件序列,任意一个事件序列包括各事件及各事件的发生次数;对任意一个事件序列,根据该事件序列中的各事件的发生次数,确定该事件序列中的各事件的事件价值参数值;还确定该事件序列中的各事件在该事件序列中的事件近期有效性参数值;对任意一个事件,根据该事件在各事件序列中的事件价值参数值,确定该事件的事件价值参数总值,并根据该事件在各事件序列中的事件近期有效性参数值,确定该事件的事件近期有效性总值;根据各事件的事件价值参数总值和事件近期有效性总值确定热点事件。本实施例提高了热点事件预测的准确性和性能。
-
-
-
-
-
-
-
-
-