-
公开(公告)号:CN106126515A
公开(公告)日:2016-11-16
申请号:CN201610312904.7
申请日:2016-05-12
Applicant: 广东电网有限责任公司信息中心 , 清华大学
IPC: G06F17/30
CPC classification number: G06F16/90
Abstract: 本发明涉及一种大数据系统构件的自动选型方法,属于计算机数据库管理技术领域,该方法分为三个阶段,训练阶段、使用阶段和动态更新阶段。用户先收集初始训练数据,进行训练阶段;再将训练阶段得到的选型决策树应用于大数据系统构件的自动选型;之后,根据用户的反馈对选型决策树进行动态更新,使得选型决策树提高选型的准确度。本方法可提高选型的准确度,能够有效减少用户对大数据系统调研、选择、决策的时间,使得用户可以快速地开发他们的大数据应用。
-
公开(公告)号:CN106020719A
公开(公告)日:2016-10-12
申请号:CN201610318767.8
申请日:2016-05-13
Applicant: 广东电网有限责任公司信息中心 , 清华大学
IPC: G06F3/06
CPC classification number: G06F3/067 , G06F3/0607 , G06F3/0629
Abstract: 本发明涉及一种分布式存储系统的初始参数配置方法,属于计算机数据库管理技术领域。该方法分为三个阶段:训练阶段、使用阶段和动态更新阶段;用户先进行训练阶段得到性能模型,然后在使用阶段将性能模型用于解决分布式存储系统的初始参数配置问题;之后,在动态更新阶段,根据用户的反馈对性能模型进行动态更新。本方法能够有效避免了传统数据库和调参工具的冷启动问题,在满足用户需求的前提下尽可能地节省硬件成本,提高系统性能,为用户带来更高的性价比。
-
公开(公告)号:CN103631912B
公开(公告)日:2016-08-03
申请号:CN201310617021.3
申请日:2013-11-28
Applicant: 清华大学
IPC: G06F17/30
Abstract: 本发明涉及一种利用非关系数据库存储海量工业设备监测数据的方法,属于计算机数据库管理技术领域。首先使多个非结构化数据管理系统组成分布式结构的非关系数据库集群,从关系数据库中读取海量工业设备监测数据,并将读取的监测数据以逗号分隔的文本文件形式存储到多台客户机中,建立一个非关系数据库存储模式,将客户机上的上述以逗号分隔的文本文件导入到非关系数据库集群中。本方法能够有效存储海量的设备监测数据,并支持快速数据查询与分析,使得企业能够对海量监测数据进行查询和分析,挖掘监测数据中具有商业价值的信息,最终达到对工业生产的设计、制造、销售、使用与维护等方面提供借鉴的目的。
-
公开(公告)号:CN103631912A
公开(公告)日:2014-03-12
申请号:CN201310617021.3
申请日:2013-11-28
Applicant: 清华大学
IPC: G06F17/30
CPC classification number: G06F17/30318
Abstract: 本发明涉及一种利用非关系数据库存储海量工业设备监测数据的方法,属于计算机数据库管理技术领域。首先使多个非结构化数据管理系统组成分布式结构的非关系数据库集群,从关系数据库中读取海量工业设备监测数据,并将读取的监测数据以逗号分隔的文本文件形式存储到多台客户机中,建立一个非关系数据库存储模式,将客户机上的上述以逗号分隔的文本文件导入到非关系数据库集群中。本方法能够有效存储海量的设备监测数据,并支持快速数据查询与分析,使得企业能够对海量监测数据进行查询和分析,挖掘监测数据中具有商业价值的信息,最终达到对工业生产的设计、制造、销售、使用与维护等方面提供借鉴的目的。
-
-
-