-
公开(公告)号:CN119357918A
公开(公告)日:2025-01-24
申请号:CN202411341026.2
申请日:2024-09-25
Applicant: 浙江华云信息科技有限公司
IPC: G06F18/28 , G06F18/23 , G06F18/15 , G06F18/22 , G06F123/02
Abstract: 本发明公开了一种基于时序数据的向量化分词方法,包括:获取时序数据并利用窗口进行分割处理得到二维数组;对二维数组分批进行一次聚类,并以所有批次的一次聚类的结果进行二次聚类得到最终聚类结果;以最终聚类结果的聚类中心和聚类簇构造时序数据字典;基于时序数据字典对时序数据进行离散化处理;基于离散化的时序数据进行词向量训练得到时序词向量。本发明通过时序词向量的形式能够捕捉到数据随时间变化的模式,相比于传统的时序数据处理可以更好地捕捉复杂的时间依赖关系,同时对时序数据进行离散化的方法适用于大数据量的聚类处理,能够控制聚类精度,不需要事先确定聚类簇数就能完成聚类。
-
公开(公告)号:CN117313082A
公开(公告)日:2023-12-29
申请号:CN202210719963.1
申请日:2022-06-23
Applicant: 浙江华云信息科技有限公司
Abstract: 本发明公开了大数据算子集市化管理方法。为了克服现有技术在开发相似大数据算法的过程中,存在大量重复开发问题,导致算法过程非常臃肿,另外类似算法中发现程序漏洞时,需要对所有类似代码进行修改的问题;本发明在提出整体算法需求的时需要对需求进行拆分、解耦,配合算粒集市化管理体系,实现复杂算法的原子化和模块化。
-
公开(公告)号:CN111198886A
公开(公告)日:2020-05-26
申请号:CN201911403256.6
申请日:2019-12-31
Applicant: 浙江华云信息科技有限公司
IPC: G06F16/22 , G06F16/2455
Abstract: 本发明公开了一种构建Hbase二级索引表方法,涉及数据库领域。Hbase本身只提供基于行键和全表扫描的查询,进行非行键的查询时需要对全表扫描,这样的查询效率低下。本发明步骤包括:hbase表上给原表建立索引表;对于原表的每条记录,在索引表上生成相应的索引记录,其索引记录的行键包括分区键、索引值、连接符和原表主键,所述的分区键为索引记录所在region的起始键字段,分区键作为索引表主键,分区键采取随机散列方式再结合索引表预分区;对分区值进行预定义;建立索引表时预先确定索引分区值;建立索引表时对索引表按照索引分区值进行预分区。可有效提升并行性能,提高查询效率。
-
公开(公告)号:CN115718877A
公开(公告)日:2023-02-28
申请号:CN202210952027.5
申请日:2022-08-09
Applicant: 浙江华云信息科技有限公司
IPC: G06F18/2321 , G06F18/22 , G06F18/24 , G06Q50/06
Abstract: 本发明公开了一种基于负荷变化特征的电力负荷曲线聚类算法,从负荷数据本身出发,将数据进行合理的分类,包括:数据预处理和阈值确定;数据聚类;离群点归类;结果上报;其中,簇数k的确定是在聚类过程中自动确定的;聚类中心的获取也是在聚类过程中得到的,根据一定的条件将簇数K控制在合理的范围内。本发明通过参数簇大小阈值t、簇距离阈值d的设定和一定的聚类规则,实现自动获取最优簇数K和最优中心点,使得数据的聚类结果趋于合理化、最优化;采用基于负荷变化特征的距离算法来完善负荷曲线的分类效果,满足负荷变化趋势,适用于用户用电负荷的聚类分析。
-
公开(公告)号:CN113568898A
公开(公告)日:2021-10-29
申请号:CN202110873162.6
申请日:2021-07-30
Applicant: 浙江华云信息科技有限公司
IPC: G06F16/215 , G06K9/62
Abstract: 本发明公开了一种电力数据漏点补全方法,包括遍历待补全电力数据,查询存在漏点数据的位置;以预设窗口大小在历史电力数据库中选取多个历史数据窗口中的历史电力数据;将每个历史数据窗口中的历史电力数据分别与漏点数据对应的邻近数据进行相似度运算,并获得相似度最高对应的历史数据窗口;根据相似度最高对应的历史数据窗口中的历史电力数据,补全漏点数据对应位置的电力数据。本申请中依据近似的历史电力数据确定出的漏点数据更为准确有效,有利于保证后续依据补全后的电力数据进行电力信息分析的准确可靠性,并促进智能电网的可靠性运行。本申请还提供了一种电力数据漏点补全装置、设备以及计算机可读存储介质,具有上述有益效果。
-
公开(公告)号:CN113568898B
公开(公告)日:2024-07-09
申请号:CN202110873162.6
申请日:2021-07-30
Applicant: 浙江华云信息科技有限公司
IPC: G06F16/215 , G06F18/22
Abstract: 本发明公开了一种电力数据漏点补全方法,包括遍历待补全电力数据,查询存在漏点数据的位置;以预设窗口大小在历史电力数据库中选取多个历史数据窗口中的历史电力数据;将每个历史数据窗口中的历史电力数据分别与漏点数据对应的邻近数据进行相似度运算,并获得相似度最高对应的历史数据窗口;根据相似度最高对应的历史数据窗口中的历史电力数据,补全漏点数据对应位置的电力数据。本申请中依据近似的历史电力数据确定出的漏点数据更为准确有效,有利于保证后续依据补全后的电力数据进行电力信息分析的准确可靠性,并促进智能电网的可靠性运行。本申请还提供了一种电力数据漏点补全装置、设备以及计算机可读存储介质,具有上述有益效果。
-
-
-
-
-