-
公开(公告)号:CN106033424B
公开(公告)日:2020-04-21
申请号:CN201510106336.0
申请日:2015-03-11
Applicant: 哈尔滨工业大学深圳研究生院 , 深圳市腾讯计算机系统有限公司
IPC: G06F16/2458 , G06F16/2455 , G06F9/46
Abstract: 本发明公开了一种数据挖掘方法和装置,属于数据挖掘领域。方法包括:扫描事务数据库,得到多个事务以及至少一个项目;获取多个候选项集;对于每个候选项集,根据候选项集中每个项目的权重以及包括候选项集的指定事务的数目,计算候选项集的加权支持度;根据每个指定事务的发生时间,计算候选项集的时效值;判断候选项集的时效值是否大于第一阈值,以及加权支持度是否大于第二阈值;当时效值大于第一阈值且加权支持度大于第二阈值时,将候选项集确定为近期高权重频繁项集。本发明考虑到项集的时效性因素,降低了出现干扰的可能性,且挖掘出的近期高权重频繁项集中的项目之间的关联规则可以准确体现近期的关联规则,提高了准确性和实用性。
-
公开(公告)号:CN106933886A
公开(公告)日:2017-07-07
申请号:CN201511030144.2
申请日:2015-12-31
Applicant: 哈尔滨工业大学深圳研究生院 , 腾讯科技(深圳)有限公司
IPC: G06F17/30
CPC classification number: G06F16/2458
Abstract: 本发明公开了一种数据处理的方法和装置,属于计算机技术领域。所述方法包括:获取样本数据记录,根据每条样本数据记录中的参数项和对应的参数值,以及预设的隶属度函数,确定每个参数值对应的参数值等级和参数值等级的权值,并根据每条样本数据记录中各参数值等级的权值,选取样本总权值大于预设阈值的参数值等级;根据在每条样本数据记录中所述选取的参数值等级对应的权值,确定满足预设组合条件的参数值等级,分别基于每个满足预设组合条件的参数值等级,确定参数值等级组合;确定每个所述参数值等级组合对应的样本总权值,输出样本总权值大于预设阈值的参数值等级组合。采用本发明,可以节约处理资源。
-
公开(公告)号:CN106033472A
公开(公告)日:2016-10-19
申请号:CN201510126268.4
申请日:2015-03-20
Applicant: 哈尔滨工业大学深圳研究生院 , 深圳市腾讯计算机系统有限公司
Abstract: 本发明公开了一种挖掘物品信息的方法及装置,属于计算机及通信领域。所述方法包括:从第一数据库中获取发生修改的第一转移记录以及从第二数据库中获取所述第一转移记录对应的第二转移记录,所述第二数据库是所述第一数据库修改前的数据库;获取所述第一转移记录中包括的各物品和所述第二转移记录中包括的各物品;根据获取的每个物品的第一事务加权效用值,所述第一转移记录和所述第二转移记录,计算所述每个物品的第二事务加权效用值,物品的第一事务加权效用值是根据所述第二数据库计算得到的;从所述每个物品中选择第二事务加权效用值满足预设条件的物品信息。本发明能够提高基于数据库发生修改操作环境下的挖掘物品信息的效率。
-
公开(公告)号:CN114199153A
公开(公告)日:2022-03-18
申请号:CN202111302306.9
申请日:2021-11-04
Applicant: 哈尔滨工业大学(深圳)
IPC: G01B11/16
Abstract: 本发明公开了一种采用新型光电传感器的桥梁形变监测系统,包括形变传感器、核心处理器、时间晶振模块、数据分析系统、网络传输模块和安全监控中心,形变传感器安装于桥梁下端面,形变传感器的信号输出端与核心处理器的信号输入端连接,核心处理器连接有时间晶振模块,核心处理器的数据输出端与数据分析系统连接,数据分析系统的数据输出端通过网络传输模块与安全监控中心连接。通过管道两端安装光电发射与接收装置构成新型传感器,从而监测桥梁的形变,采用管道式不会因空气质量、烟雾等导致光信号接收不稳定的情况,从而能够准确稳定的采集桥梁形变信号,并对形变信号进行分析,当数据异常时即使报警和通知监控中心,利于即使维护或解除危险。
-
公开(公告)号:CN107870913B
公开(公告)日:2021-12-14
申请号:CN201610847309.3
申请日:2016-09-23
Applicant: 腾讯科技(深圳)有限公司 , 哈尔滨工业大学深圳研究生院
IPC: G06F16/2458
Abstract: 本发明实施例提供一种有效时间的高期望权重项集挖掘方法、装置及处理设备,该方法包括:确定待处理项集所对应的至少一个目标事务;确定所述待处理项集在不确定数据库中的时间有效值;确定所述待处理项集的期望支持度;将所述待处理项集的期望支持度,和所述待处理项集的项集权重值相乘,确定所述待处理项集的期望权重支持度;如果所述待处理项集在不确定数据库中的时间有效值不小于,预定义的最低时间有效阈值,且所述待处理项集的期望权重支持度,不小于,预定义的最低期望权重阈值和不确定数据库中事务总数的乘积,则确定所述待处理项集为有效时间的高期望权重项集。本发明实施例实现了不确定数据库中有效时间的高期望权重项集的挖掘。
-
公开(公告)号:CN107870956B
公开(公告)日:2021-04-27
申请号:CN201610866557.2
申请日:2016-09-28
Applicant: 腾讯科技(深圳)有限公司 , 哈尔滨工业大学深圳研究生院
IPC: G06F16/2458 , G06Q30/06
Abstract: 本发明实施例提供一种高效用项集挖掘方法、装置及数据处理设备,该方法包括:确定事务数据库中各项集对应的项集效用值;根据预定义的最低效用阈值表,确定各项集对应的项集最低效用阈值;预定义的最低效用阈值表记录有各数据项对应的最低效用阈值,一个项集对应的项集最低效用阈值表示的是,该项集包含的数据项所对应的最低效用阈值中的最小最低效用阈值。将各项集的项集效用值与对应的项集最低效用阈值进行比对,根据比对结果确定高效用项集,其中,高效用项集的项集效用值不小于对应的项集最低效用阈值。本发明实施例提高了高效用项集挖掘的准确性。
-
公开(公告)号:CN107870939B
公开(公告)日:2021-04-27
申请号:CN201610856770.5
申请日:2016-09-27
Applicant: 腾讯科技(深圳)有限公司 , 哈尔滨工业大学深圳研究生院
IPC: G06F16/2458
Abstract: 本申请公开了一种模式挖掘方法及装置,针对获取的候选模式集合,计算其在各事务中的效用值,对于效用值小于设定的效用阀值的事务进行删除,该部分事务的模式效用值过小,删除后可以减少挖掘计算时间,并根据删除后剩余的目标事务的时间属性,确定候选模式的周期值,在该周期值小于等于设定的周期阀值时,将候选模式确定为挖掘结果,保证了挖掘得到的模式的效用值在时间上分布均匀,更加便于精确决策。
-
公开(公告)号:CN110367989A
公开(公告)日:2019-10-25
申请号:CN201910701432.8
申请日:2019-07-31
Applicant: 深圳职业技术学院 , 哈尔滨工业大学深圳研究生院
Abstract: 本发明公开了一种用于外骨骼足底压力采集的传感器结构,包括第一仿生绝缘薄膜、第二仿生绝缘薄膜、设置于所述第一仿生绝缘薄膜和第二仿生绝缘薄膜之间的若干压力采集单元、与所述若干压力采集单元连接的信号放大器。本发明用于外骨骼足底压力采集的传感器结构巧妙的将人体工程学、仿生学、结构学相融合,将多个压力采集单元按照人脚生理学形状布置,与外骨骼结构有机的结合起来,由于压力采集点较多,可以采集更多的足底压力,形成有效的足底压力分布云图,为外骨骼控制系统预判用户行动意图提供有效依据,可有效减少外骨骼上的其他传感器数量,降低产品成本,提高控制系统可靠性。
-
公开(公告)号:CN109902303A
公开(公告)日:2019-06-18
申请号:CN201910158600.3
申请日:2019-03-01
Applicant: 腾讯科技(深圳)有限公司 , 哈尔滨工业大学(深圳)
Abstract: 本发明实施例公开了一种实体识别方法及相关设备,包括:首先获取多条标注语料,所述多条标注语料中每条标注语料携带标注信息;接着按照预设的实体标注规则建立超图模型;然后根据标注信息和实体标注规则确定每条标注语料对应的标注路径图、以及根据超图模型和预设的神经网络模型建立待训练模型;最后将标注路径图输入待训练模型中进行训练,得到实体识别模型,并根据实体识别模型,识别输入语料中的至少一个命名实体。采用本发明实施例,可以有效识别嵌套结构的实体,从而提高实体识别和实体抽取的准确性。
-
公开(公告)号:CN109885702A
公开(公告)日:2019-06-14
申请号:CN201910146893.3
申请日:2019-02-27
Applicant: 哈尔滨工业大学(深圳) , 腾讯科技(深圳)有限公司
Abstract: 本申请是关于一种自然语言处理中的序列标注方法,该方法包括:获取文本序列,将文本序列输入序列标注模型,获得目标路径,目标路径中的每一个节点是预设标签集中的一个标签,预设标签集中包含m种编码模式对应的各个标签;将目标路径中的各个节点按照在目标路径中从先到后的顺序排列,获得文本序列对应的标注序列。本申请根据多种编码模式对文本序列样本编码的结果进行训练获得序列标注模型,并通过该序列模型标签对输入的文本序列进行处理,输出该文本序列对应的标注序列,使得文本序列的标注不局限于单个编码模式,从而提高了序列标注模型对不同输入的普适性,提高序列标注的效果。
-
-
-
-
-
-
-
-
-