-
公开(公告)号:CN105159895A
公开(公告)日:2015-12-16
申请号:CN201410231415.X
申请日:2014-05-28
Applicant: 国际商业机器公司
IPC: G06F17/30
CPC classification number: G06F16/2264 , G06F16/2455 , G06F16/24552 , G06F16/24557 , G06F16/50 , G06F16/51
Abstract: 本公开内容涉及用于存储和查询数据的方法和系统。根据本发明的实施例,针对多维数据建立两级索引,一级索引基于两个或更多维度创建,用于检索数据的各个数据单元。二级索引基于特定的维度创建,用于检索数据单元中的各数据块。相应地,在接收到针对数据的多维查询请求时,一级检索首先根据一级索引确定包含目标数据的数据单元。继而,二级检索根据二级索引快速定位包含目标数据的数据块。这样,多维检索可以高效地完成。而且,通过适当地设置最小数据块的大小,数据访问的I/O效率显著提高。公开了相应的方法和系统。
-
公开(公告)号:CN104809134B
公开(公告)日:2018-03-09
申请号:CN201410040085.6
申请日:2014-01-27
Applicant: 国际商业机器公司
IPC: G06F17/30
CPC classification number: G06F11/0751 , G05B23/0232
Abstract: 公开了一种检测数据序列中的异常子序列的方法和设备。该方法包括:构造目标子序列的分层数据结构;基于目标子序列的分层数据结构以及预先构造的第一数量的参考子序列的分层数据结构,确定目标子序列的第二数量的邻居,即,所述第一数量的参考子序列中、与目标子序列的欧几里德距离最小的第二数量的参考子序列;确定所述第二数量的参考子序列中的每个参考子序列的第三数量的邻居,即,所述数据序列中、与所述每个参考子序列的欧几里德距离最小的第三数量的子序列;以及根据目标子序列的第二数量的邻居、以及所述第二数量的参考子序列中以所述目标子序列为其邻居的参考子序列的第三数量的邻居,确定所述目标子序列是否为异常子序列。
-
公开(公告)号:CN104809134A
公开(公告)日:2015-07-29
申请号:CN201410040085.6
申请日:2014-01-27
Applicant: 国际商业机器公司
IPC: G06F17/30
CPC classification number: G06F11/0751 , G05B23/0232
Abstract: 公开了一种检测数据序列中的异常子序列的方法和设备。该方法包括:构造目标子序列的分层数据结构;基于目标子序列的分层数据结构以及预先构造的第一数量的参考子序列的分层数据结构,确定目标子序列的第二数量的邻居,即,所述第一数量的参考子序列中、与目标子序列的欧几里德距离最小的第二数量的参考子序列;确定所述第二数量的参考子序列中的每个参考子序列的第三数量的邻居,即,所述数据序列中、与所述每个参考子序列的欧几里德距离最小的第三数量的子序列;以及根据目标子序列的第二数量的邻居、以及所述第二数量的参考子序列中以所述目标子序列为其邻居的参考子序列的第三数量的邻居,确定所述目标子序列是否为异常子序列。
-
公开(公告)号:CN104516894A
公开(公告)日:2015-04-15
申请号:CN201310452861.9
申请日:2013-09-27
Applicant: 国际商业机器公司
IPC: G06F17/30
CPC classification number: G06F17/30091 , G06F17/30144 , G06F17/30365 , G06F17/30386 , G06Q10/067 , G06F17/30548 , G06F17/30321
Abstract: 本发明的各实施方式提供了用于管理时间序列数据库的方法和装置。在一个实施方式中,提供了一种用于管理时间序列数据库的方法,包括:监视针对时间序列数据库进行访问的多个操作以识别多个操作的类型,多个操作的类型包括查询类型和插入类型中的至少任一项;针对多个存储模式中的存储模式,分别基于类型来获取多个操作对时间序列数据库进行访问的成本;从多个存储模式中选择与最低成本相对应的存储模式;以及在预定时间段期间,根据选择的存储模式来向时间序列数据库中存储从多个测量点处采集的数据值。在一个实施方式中,提供了一种用于管理时间序列数据库的装置。采用本发明的方法和装置,可以提高向时间序列数据库的存储效率和查询效率。
-
公开(公告)号:CN105630756A
公开(公告)日:2016-06-01
申请号:CN201410602508.9
申请日:2014-10-31
Applicant: 国际商业机器公司
CPC classification number: G06F17/246 , G06F17/30392 , G06F17/30427 , G06F17/30554
Abstract: 本发明公开了一种数据处理设备和方法。所述数据处理设备包括:电子数据表,所述电子数据表包含数据显示行和超行,所述数据显示行用于显示在数据库中查询到的部分数据,所述超行用于表示在所述数据库中查询到的、所述数据显示行显示的所述部分数据之外的数据;数据处理器,被配置为响应于在所述电子数据表中创建公式,以及所述公式引用所述超行中的至少一个单元格,基于在所述数据库中查询到的数据计算所述公式的值。根据本发明的设备和方法,当数据的数量巨大时,能消除从数据库到电子数据表的数据装载的开销,对于新出现的数据,能够连续更新电子数据表中的结果数据,并与目前电子数据表的软件架构兼容,能够最小化开发成本和用户移植成本。
-
公开(公告)号:CN104216887A
公开(公告)日:2014-12-17
申请号:CN201310207883.9
申请日:2013-05-30
Applicant: 国际商业机器公司
IPC: G06F17/30
CPC classification number: G06F17/30557
Abstract: 本公开涉及用于对采样数据进行总结的方法和装置。该方法包括:根据下一层的时间粒度范围的最小值,对当前层的多个聚合值进行分组,各聚合值包含至少一个分量,所述分量包含被聚合为该聚合值的采样数据的平均值;针对每个分组,对该分组中的所有聚合值中包含的平均值求取平均,得到该分组的分组平均值;在所述时间粒度范围内对分组平均值接近的相邻分组进行合并以得到新的分组,并对该新的分组中的所有聚合值中包含的平均值求取平均以得到该新的分组的分组平均值;针对合并得到的新的分组和未被合并的分组中的每一个,将该分组的分组平均值确定为所述下一层的与该分组对应的聚合值中所包含的平均值。从而,能够实现对采样数据的准确总结。
-
公开(公告)号:CN105653559B
公开(公告)日:2019-05-10
申请号:CN201410714219.8
申请日:2014-11-28
Applicant: 国际商业机器公司
IPC: G06F16/28 , G06F16/2458
Abstract: 本发明提供了用于在数据库中进行搜索的方法和装置。提供了搜索方法,包括:响应于接收到针对数据库进行搜索的搜索请求,从搜索请求中提取在数据库中进行搜索的条件;基于针对所述数据库执行的历史搜索的历史统计数据,从注册到所述数据库的多个搜索算法中选择匹配于所述条件的搜索算法;以及利用搜索算法从数据库获得搜索结果,其中数据库是时间序列数据库。进一步,提供了在包括时间序列数据库和关系数据库的数据库系统中进行搜索的方法。采用本发明的方法和装置,可以提高搜索效率。
-
公开(公告)号:CN104516894B
公开(公告)日:2018-08-17
申请号:CN201310452861.9
申请日:2013-09-27
Applicant: 国际商业机器公司
IPC: G06F17/30
CPC classification number: G06F17/30091 , G06F17/30144 , G06F17/30365 , G06F17/30386 , G06Q10/067
Abstract: 本发明的各实施方式提供了用于管理时间序列数据库的方法和装置。在一个实施方式中,提供了一种用于管理时间序列数据库的方法,包括:监视针对时间序列数据库进行访问的多个操作以识别多个操作的类型,多个操作的类型包括查询类型和插入类型中的至少任一项;针对多个存储模式中的存储模式,分别基于类型来获取多个操作对时间序列数据库进行访问的成本;从多个存储模式中选择与最低成本相对应的存储模式;以及在预定时间段期间,根据选择的存储模式来向时间序列数据库中存储从多个测量点处采集的数据值。在一个实施方式中,提供了一种用于管理时间序列数据库的装置。采用本发明的方法和装置,可以提高向时间序列数据库的存储效率和查询效率。
-
公开(公告)号:CN105224543A
公开(公告)日:2016-01-06
申请号:CN201410240668.3
申请日:2014-05-30
Applicant: 国际商业机器公司
IPC: G06F17/30
Abstract: 本发明的各实施方式提供了用于处理时间序列的方法和装置。在一个实施方式中,提供了一种处理时间序列的方法,包括:按照时间将时间序列划分为多个窗口,针对多个窗口中的当前窗口执行如下处理:从当前窗口中提取相似子序列的至少一个分组;以及基于至少一个分组中的每个分组中的相似子序列与候选列表中的k个特征子序列的比较,更新候选列表,其中k个特征子序列是在时间序列的至少已处理部分中出现次数最多的k个特征子序列。在一个实施方式中,提供了在时间序列中进行搜索的方法,包括:响应于接收到搜索请求,返回候选列表以作为搜索结果,其中候选列表是基于本发明的方法中的候选列表。采用本发明的方法和装置,可以更为有效地管理时间序列。
-
公开(公告)号:CN103853752A
公开(公告)日:2014-06-11
申请号:CN201210507004.X
申请日:2012-11-30
Applicant: 国际商业机器公司
IPC: G06F17/30
CPC classification number: G06F17/30536
Abstract: 本发明提供了管理时间序列数据库的方法和装置。具体地,提供了针对时间序列数据库中的时间序列建立索引的方法,包括:将时间序列数据库中的时间序列划分为多个子序列;针对多个子序列建立空间索引,空间索引定义多个子序列中的子序列在时间序列中的空间位置;以及针对多个子序列建立内容索引,内容索引定义多个子序列中的子序列的内容范围。还提供了在时间序列数据库中进行查询的方法,包括:基于空间索引,在时间序列数据库中的时间序列中搜索与一查询序列相对应的空间位置;基于内容索引,获取在所搜索的空间位置处的子序列的内容范围;以及响应于所获取的内容范围与查询序列的内容范围相一致,输出所搜索的空间位置处的子序列。
-
-
-
-
-
-
-
-
-