-
公开(公告)号:CN117009361A
公开(公告)日:2023-11-07
申请号:CN202310887412.0
申请日:2023-07-19
Applicant: 浙江大学
Abstract: 本发明公开了一种两阶段无锁并行日志回放方法和装置,该方法包括:只读节点从日志缓冲区中读取至少一条重做日志;根据数据页将重做日志分配给对应的日志回放线程;日志回放线程将重做日志中的增量修改内容应用到行存的数据页上,并利用重做日志复用方法解析出逻辑日志;根据逻辑日志构造原始事务,并交付给逻辑日志分配器;逻辑日志分配器根据逻辑日志中的主键将逻辑日志分配给对应的日志回放线程;日志回放线程并行地回放逻辑日志,将逻辑日志上的修改应用到列存引擎中,完成列存数据的同步。本发明能够最大限度地利用多核处理器的计算处理能力,降低并发控制带来的性能开销,提高系统的日志回放性能和资源利用率,具有实用性和经济效益。
-
公开(公告)号:CN104572886A
公开(公告)日:2015-04-29
申请号:CN201410812464.2
申请日:2014-12-23
Applicant: 浙江大学
IPC: G06F17/30
CPC classification number: G06F17/30946
Abstract: 本发明公开了一种基于K线图表示的金融时间序列相似性查询方法,包括特征提取、索引构建和查询处理步骤。首先,基于K线表示对金融时间序列提取基本模式与典型模式特征,将其分别转化为基本字符串与典型字符串;然后,分别对两者构建倒排索引。对于每条查询序列,经相同方式提取基本模式与典型模式特征后,分别查询所构建的两个倒排索引,获取两个候选集,然后求交集运算得到最终候选集;再经后续处理得到最终查询结果。本发明可有效实现k最近邻查询,具有较高的度量精度及查询效率,并对时间序列长度、k最近邻查询规模及数据集规模具有良好的扩展性。在规模日益扩大的电子化金融交易市场中可发挥重要作用。
-
公开(公告)号:CN116974625A
公开(公告)日:2023-10-31
申请号:CN202310839398.7
申请日:2023-07-10
Applicant: 浙江大学
IPC: G06F8/73 , G06F16/35 , G06F16/33 , G06N3/0475 , G06N3/0464 , G06N3/0455 , G06N3/048 , G06N3/08
Abstract: 本发明公开了一种基于稠密检索和关系建模的代码注释生成方法,该方法使用稠密检索来检索相关的注释作为额外输入,并抽取代码和额外注释输入的关系,从而提高注释生成质量。本方法主要用检索器在检索集中检索输入代码的相关注释,将代码和检索到的注释拼接后输入到鉴别器,得到融合表征向量和得到关系表征向量和关系分类将融合表征向量和关系表征向量输入第二多层解码器,生成代码注释。本发明首次将额外输入与原始输入的关系考虑在内,能够有效避免生成器被误导,进而提高生成效果。
-
公开(公告)号:CN104572886B
公开(公告)日:2018-01-30
申请号:CN201410812464.2
申请日:2014-12-23
Applicant: 浙江大学
IPC: G06F17/30
Abstract: 本发明公开了一种基于K线图表示的金融时间序列相似性查询方法,包括特征提取、索引构建和查询处理步骤。首先,基于K线表示对金融时间序列提取基本模式与典型模式特征,将其分别转化为基本字符串与典型字符串;然后,分别对两者构建倒排索引。对于每条查询序列,经相同方式提取基本模式与典型模式特征后,分别查询所构建的两个倒排索引,获取两个候选集,然后求交集运算得到最终候选集;再经后续处理得到最终查询结果。本发明可有效实现k最近邻查询,具有较高的度量精度及查询效率,并对时间序列长度、k最近邻查询规模及数据集规模具有良好的扩展性。在规模日益扩大的电子化金融交易市场中可发挥重要作用。
-
公开(公告)号:CN104820673A
公开(公告)日:2015-08-05
申请号:CN201510139785.5
申请日:2015-03-27
Applicant: 浙江大学
IPC: G06F17/30
Abstract: 本发明公开了一种基于自适应性分段统计近似的时间序列相似性度量方法,首先基于时间序列编码识别转折点,将时间序列切分为包含完整波动趋势的子序列;然后依次提取每条子序列的多种统计特征,构造局部模式特征向量;最后利用规范化距离计算局部模式特征向量之间的距离,实现局部模式匹配,并以此作为动态规划算法的子程序,实现全局模式匹配。本发明在度量精度和计算效率方面都以较大的程度优于其他度量方法,在人们的日常活动和工业生产中可发挥重要作用,如在金融交易、交通监管、空气质量和温度监测、工业流程监控、医疗诊断等应用中,对大规模采样数据或高速动态数据流进行相似性查询、分类、聚类、预测、异常检测、在线模式识别等处理。
-
公开(公告)号:CN104794484A
公开(公告)日:2015-07-22
申请号:CN201510160913.4
申请日:2015-04-07
Applicant: 浙江大学
IPC: G06K9/62
Abstract: 本发明公开了一种基于分段正交多项式分解的时序数据最近邻分类方法,首先,基于时间序列编码识别转折点,将时间序列切分为包含完整波动趋势的子序列;然后,利用第一类切比雪夫多项式分解子序列,提取切比雪夫系数作为子序列特征,构造子序列特征向量;最后,在最近邻分类器中,以基于局部模式匹配的动态规划算法作为距离度量函数实现分类。本发明在分类精度和分类效率方面都以较大的程度优于其他最近邻分类器,在人们的日常活动和工业生产中可发挥重要作用,如在金融交易、交通监管、空气质量和温度监测、工业流程监控、医疗诊断等应用中,对大规模采样数据或高速动态数据流进行分类、预测、异常检测、在线模式识别等处理。
-
公开(公告)号:CN104182460A
公开(公告)日:2014-12-03
申请号:CN201410344607.1
申请日:2014-07-18
Applicant: 浙江大学
IPC: G06F17/30
CPC classification number: G06F17/30321 , G06F17/30327 , G06F17/30336 , G06F17/30412 , G06F17/30427 , G06F17/30439
Abstract: 本发明公开了一种基于倒排索引的时间序列相似性查询方法,包含索引构建和查询处理步骤,首先利用符号聚集近似表示将实值型的时间序列转化为离散的字符串,然后提取特征子序列,利用向量近似文件存储编码,将子序列分别转为两种粒度的词插入倒排索引,构建多粒度时序倒排索引。针对该索引设计了高效的两级过滤查询方法,可实现k最近邻近似查询,在保证较高查准率的前提下,实现较低的查询时间开销,并且对时间序列长度、k最近邻查询规模及数据集规模具有良好的可扩展性。本发明在人们的日常活动和工业生产中可发挥重要作用,如股票波动的实时查询、传感器数据流的在线模式识别等。
-
-
-
-
-
-