-
公开(公告)号:CN113240011B
公开(公告)日:2023-04-07
申请号:CN202110528781.1
申请日:2021-05-14
Applicant: 烟台海颐软件股份有限公司
IPC: G06F18/241 , G06F18/2415 , G06F18/23 , G06N3/0464 , G06N3/047 , G06N3/08
Abstract: 本发明涉及数据处理领域,具体涉及一种深度学习驱动的异常识别与修复方法及智能化系统。包括以下步骤:S1:数据结构识别,S2:数据特征变换,S3:训练异常检测和修复神经网络,S4:异常数据识别与异常修复,S5:数据特征还原。采用深度学习方法,对每个特征使用双分量混合模型,其中一个分量用于解释干净单元(即正常值),另一个分量用于解释异常单元(即异常值);通过降低异常单元的影响来模拟潜在的正常数据分布,为数据单元提供异常值分数和对单元修复的估计;将变分自编码器和生成对抗网络两个深度生成模型进行结合,有利于生成更好的修复结果;最终实现利用无监督学习方式对混合属性数据进行cell‑level(单元级别)的异常识别及修复。
-
公开(公告)号:CN115809274A
公开(公告)日:2023-03-17
申请号:CN202211629856.6
申请日:2022-12-19
Applicant: 烟台海颐软件股份有限公司
IPC: G06F16/2455 , G06F16/23 , G06Q50/06
Abstract: 本发明属于电力系统技术领域,具体涉及一种电力量价费一致性核查规则挖掘方法与系统。所述方法包括:获取核查数据集,计算量价费数据的等价分划;使用深度优先空间搜索策略挖掘数据一致性关系,得到数据中的一致性关系集合;利用得到的一致性关系集合,对量价费一致性关系进行规则解析;通过规则解析,识别出在量价费数据中的罕见数据。本发明将一种新的针对分类型数据的一致性规则挖掘方法应用在电力量价费数据的核查工作中,能主动挖掘出数据中的潜在规则,良好地弥补了以往人工定义规则存在工作量大、耗时长、规则覆盖面不足、只能发现被定义规则覆盖的业务异常数据等短板,辅助业务人员更智能、更全面地完成电力营销量价费数据核查工作。
-
公开(公告)号:CN116128544B
公开(公告)日:2024-12-10
申请号:CN202211642952.4
申请日:2022-12-20
Applicant: 烟台海颐软件股份有限公司
IPC: G06Q30/0201 , G06Q30/0202 , G06Q50/06 , G06F18/214 , G06F18/2431 , G06N20/00
Abstract: 本发明公开了一种电力营销异常营业数据的主动稽核方法和系统,所述方法包括:计算给定待稽核数据中各分类属性间的信息增益率,分析分类属性业务关联;基于分类属性间的相关性分析结果,对存在显著相关性的属性进行拼接,形成新的混合数据;基于新的混合数据,对分类属性进行频数特征变换,生成能够直接输入模型训练的属性特征数据;基于属性特征数据,以增强孤立森林算法为基础构建并训练增强孤立森林模型;以训练好的增强孤立森林模型为基础,计算电力营销营业数据的异常评分;基于电力营销营业数据的异常评分,自适应判别异常群体,得到自适应异常结果;根据输出的自适应异常结果,将其与电力营销营业数据相结合,输出最终的异常判别结果。
-
公开(公告)号:CN117454188A
公开(公告)日:2024-01-26
申请号:CN202311095887.2
申请日:2023-08-29
Applicant: 烟台海颐软件股份有限公司
IPC: G06F18/22 , G06F40/30 , G06F40/216 , G06F40/289
Abstract: 本发明公开了一种基于标准数据元的多策略数据治理规则适配方法及系统,该方法包括:数据准备;进行字段定义匹配;进行特殊字段匹配;进行语义相似度匹配,根据LCS相似度和余弦相似度完成语义相似度匹配;进行编码信息匹配;进行算法匹配结果推荐;进行推荐结果审核研判;输出最终匹配结果。本发明通过在系统中引入“标准数据元”的概念,建立数据元与标准数据元间的映射关系,并结合标准数据元与通用规则、标准参考数据之间的映射关系,实现数据元与通用规则、标准参考数据的自动绑定,生成数据标准规则,从而实现数据元与标准规则的适配。
-
公开(公告)号:CN119739837A
公开(公告)日:2025-04-01
申请号:CN202510237478.4
申请日:2025-03-03
Applicant: 烟台海颐软件股份有限公司
IPC: G06F16/3329 , G06N5/022 , G06Q50/06 , G06F16/31
Abstract: 本发明属于电力自然语言数据问答技术领域,具体涉及一种多元知识链接驱动的NL2SQL问题增强方法。所述方法包括:利用数据库表信息构建电力数据模式,并梳理出电力领域知识;构建问题解析Prompt模板,并利用大语言模型分析原始问题的结构,从原始问题中提取关键实体;基于梳理出的电力领域知识及从原始问题中提取的关键实体,采用混合相似度检索的方式检索电力领域知识;通过多级模式链接方法,以获取到与原始问题相关的数据库表与数据模式;基于检索出的电力领域知识及所获取到的数据模式,进行知识标准化并设计问题增强Prompt模板,利用大语言模型对原始问题进行重构增强,消除混淆和干扰因素,提高问答的准确度。
-
公开(公告)号:CN113240011A
公开(公告)日:2021-08-10
申请号:CN202110528781.1
申请日:2021-05-14
Applicant: 烟台海颐软件股份有限公司
Abstract: 本发明涉及数据处理领域,具体涉及一种深度学习驱动的异常识别与修复方法及智能化系统。包括以下步骤:S1:数据结构识别,S2:数据特征变换,S3:训练异常检测和修复神经网络,S4:异常数据识别与异常修复,S5:数据特征还原。采用深度学习方法,对每个特征使用双分量混合模型,其中一个分量用于解释干净单元(即正常值),另一个分量用于解释异常单元(即异常值);通过降低异常单元的影响来模拟潜在的正常数据分布,为数据单元提供异常值分数和对单元修复的估计;将变分自编码器和生成对抗网络两个深度生成模型进行结合,有利于生成更好的修复结果;最终实现利用无监督学习方式对混合属性数据进行cell‑level(单元级别)的异常识别及修复。
-
公开(公告)号:CN113240010A
公开(公告)日:2021-08-10
申请号:CN202110528743.6
申请日:2021-05-14
Applicant: 烟台海颐软件股份有限公司
IPC: G06K9/62
Abstract: 本发明涉及结构化数据异常检测领域,具体涉及一种支持非独立分布混合数据的异常检测方法及系统。包括元数据管理模块,数据集成模块,数据管理模块,任务管理与调度模块,数据关联模块,特征变换模块,模型训练模块,异常评估模块,结果管理模块。基于本算法构建的系统可以适用于结构化混合数据、单纯的分类数据、单纯的数值型数据三种不同目的智能化异常检测,可以极大的提升异常检测的效率和普适性,尤其是在数据治理、工业异常检测应用中。
-
公开(公告)号:CN117763305A
公开(公告)日:2024-03-26
申请号:CN202311729543.2
申请日:2023-12-15
Applicant: 烟台海颐软件股份有限公司
IPC: G06F18/20 , G06F18/232 , G06F18/243 , G06N3/0442
Abstract: 本发明公开了一种计及行为共性的电力时序数据异常检测与修复方法,包括如下步骤:根据电力时序数据进行行为共性分析,获取到电力时序数据的群体聚类结果;根据电力时序数据计算时序异常得分,生成所有数据的异常得分集合;根据聚类结果和异常得分集合,进行计及行为共性的电力时序数据异常识别;根据异常识别结果和聚类结果,进行计及行为共性的电力时序数据异常修复。本发明从行为共性分析、时序异常评估、异常值修复三方面提出了创新性方案,有效提高了对于电力时序数据的异常检测与修复的准确度,解决了现有方法难以精准识别异常并修复的问题,这一完整流程对电力系统中的智能数据治理具有重要意义。
-
公开(公告)号:CN113240010B
公开(公告)日:2023-10-24
申请号:CN202110528743.6
申请日:2021-05-14
Applicant: 烟台海颐软件股份有限公司
IPC: G06F18/2433
Abstract: 本发明涉及结构化数据异常检测领域,具体涉及一种支持非独立分布混合数据的异常检测方法及系统。包括元数据管理模块,数据集成模块,数据管理模块,任务管理与调度模块,数据关联模块,特征变换模块,模型训练模块,异常评估模块,结果管理模块。基于本算法构建的系统可以适用于结构化混合数据、单纯的分类数据、单纯的数值型数据三种不同目的智能化异常检测,可以极大的提升异常检测的效率和普适性,尤其是在数据治理、工业异常检测应用中。
-
公开(公告)号:CN116128544A
公开(公告)日:2023-05-16
申请号:CN202211642952.4
申请日:2022-12-20
Applicant: 烟台海颐软件股份有限公司
IPC: G06Q30/0201 , G06Q30/0202 , G06Q50/06 , G06F18/214 , G06F18/2431 , G06N20/00
Abstract: 本发明公开了一种电力营销异常营业数据的主动稽核方法和系统,所述方法包括:计算给定待稽核数据中各分类属性间的信息增益率,分析分类属性业务关联;基于分类属性间的相关性分析结果,对存在显著相关性的属性进行拼接,形成新的混合数据;基于新的混合数据,对分类属性进行频数特征变换,生成能够直接输入模型训练的属性特征数据;基于属性特征数据,以增强孤立森林算法为基础构建并训练增强孤立森林模型;以训练好的增强孤立森林模型为基础,计算电力营销营业数据的异常评分;基于电力营销营业数据的异常评分,自适应判别异常群体,得到自适应异常结果;根据输出的自适应异常结果,将其与电力营销营业数据相结合,输出最终的异常判别结果。
-
-
-
-
-
-
-
-
-