-
公开(公告)号:CN117743938A
公开(公告)日:2024-03-22
申请号:CN202311785567.X
申请日:2023-12-22
Applicant: 烟台海颐软件股份有限公司
IPC: G06F18/241 , G06F18/213 , G06F18/232 , G06N3/0455
Abstract: 本发明属于数据治理技术领域,具体涉及一种不均衡数据的异常识别与修复方法及系统。所述方法包括不均衡混合数据聚类分析、异常数据识别与特征定位、异常数据修复三部分内容,首先提出了基于代价优化的混合聚类算法,解决不均衡数据集下混合数据的有效聚类问题,实现同一聚类簇内数据具有高度相似性;其次提出一种基于孤立森林的异常特征定位算法,解决以往无监督异常检测算法仅能定位到异常记录而无法识别记录中具体异常特征的问题,实现问题数据的准确定位;最后提出基于异构变分自编码器的数据修复模型,实现对混合数据异常的可信修复,解决以往人工智能方法在数据修复过程中受数据分布和噪声数据干扰过大导致修复数据可信度不高的问题。
-
公开(公告)号:CN119739837A
公开(公告)日:2025-04-01
申请号:CN202510237478.4
申请日:2025-03-03
Applicant: 烟台海颐软件股份有限公司
IPC: G06F16/3329 , G06N5/022 , G06Q50/06 , G06F16/31
Abstract: 本发明属于电力自然语言数据问答技术领域,具体涉及一种多元知识链接驱动的NL2SQL问题增强方法。所述方法包括:利用数据库表信息构建电力数据模式,并梳理出电力领域知识;构建问题解析Prompt模板,并利用大语言模型分析原始问题的结构,从原始问题中提取关键实体;基于梳理出的电力领域知识及从原始问题中提取的关键实体,采用混合相似度检索的方式检索电力领域知识;通过多级模式链接方法,以获取到与原始问题相关的数据库表与数据模式;基于检索出的电力领域知识及所获取到的数据模式,进行知识标准化并设计问题增强Prompt模板,利用大语言模型对原始问题进行重构增强,消除混淆和干扰因素,提高问答的准确度。
-
公开(公告)号:CN119003744B
公开(公告)日:2025-02-11
申请号:CN202411487039.0
申请日:2024-10-24
Applicant: 烟台海颐软件股份有限公司
IPC: G06F16/332 , G06F16/334 , G06F16/38 , G06F40/186 , G06F40/226
Abstract: 本发明属于电力数据治理技术领域,具体涉及一种基于KCMAP的电力数据治理可信规划工作流方法,包括:面向电力数据治理设计知识组织结构并构建领域知识库且向量化存储;设计多阶知识prompt构建DR‑RAG模型从向量库中检索知识片段并利用LLM合成领域流程;设计知识能力匹配智能体,将领域流程知识与可用智能体基于智能体能力规约进行匹配,并修正领域流程知识;设计任务可信规划智能体,对电力数据治理作业基于领域知识流程进行分解和规划,生成任务计划;设计两阶段验证机制,确保任务计划的合理性与调度执行的准确性。
-
公开(公告)号:CN116128544B
公开(公告)日:2024-12-10
申请号:CN202211642952.4
申请日:2022-12-20
Applicant: 烟台海颐软件股份有限公司
IPC: G06Q30/0201 , G06Q30/0202 , G06Q50/06 , G06F18/214 , G06F18/2431 , G06N20/00
Abstract: 本发明公开了一种电力营销异常营业数据的主动稽核方法和系统,所述方法包括:计算给定待稽核数据中各分类属性间的信息增益率,分析分类属性业务关联;基于分类属性间的相关性分析结果,对存在显著相关性的属性进行拼接,形成新的混合数据;基于新的混合数据,对分类属性进行频数特征变换,生成能够直接输入模型训练的属性特征数据;基于属性特征数据,以增强孤立森林算法为基础构建并训练增强孤立森林模型;以训练好的增强孤立森林模型为基础,计算电力营销营业数据的异常评分;基于电力营销营业数据的异常评分,自适应判别异常群体,得到自适应异常结果;根据输出的自适应异常结果,将其与电力营销营业数据相结合,输出最终的异常判别结果。
-
公开(公告)号:CN117454188A
公开(公告)日:2024-01-26
申请号:CN202311095887.2
申请日:2023-08-29
Applicant: 烟台海颐软件股份有限公司
IPC: G06F18/22 , G06F40/30 , G06F40/216 , G06F40/289
Abstract: 本发明公开了一种基于标准数据元的多策略数据治理规则适配方法及系统,该方法包括:数据准备;进行字段定义匹配;进行特殊字段匹配;进行语义相似度匹配,根据LCS相似度和余弦相似度完成语义相似度匹配;进行编码信息匹配;进行算法匹配结果推荐;进行推荐结果审核研判;输出最终匹配结果。本发明通过在系统中引入“标准数据元”的概念,建立数据元与标准数据元间的映射关系,并结合标准数据元与通用规则、标准参考数据之间的映射关系,实现数据元与通用规则、标准参考数据的自动绑定,生成数据标准规则,从而实现数据元与标准规则的适配。
-
公开(公告)号:CN117131449A
公开(公告)日:2023-11-28
申请号:CN202311087471.6
申请日:2023-08-28
Applicant: 烟台海颐软件股份有限公司
IPC: G06F18/2433 , G06F18/2415 , G06F18/23213 , G06F18/214 , G06F18/15 , G06N3/0895
Abstract: 本发明公开了一种面向数据治理的具有传播学习能力的异常识别方法及系统,该方法包括:配置文件加载,读取待检测数据,且区分为数值型字段和分类型字段;对待检测数据进行预处理,获取到采样区间和初始标签;根据采样区间进行数据采样,结合交互标记操作,训练字段级异常分类器与记录级异常分类器;利用训练好的字段级异常分类器和记录级异常分类器分别对待检测数据进行字段级异常识别和记录级异常识别,输出异常数据。本发明依据采样算法抽取有代表性的数据,通过系统中集成的用户交互模块对数据进行标注,通过标签传播扩展标签数量,大幅减少所需标签数据的数量,训练有监督的分类模型并结合主动学习提升混合数据异常识别的准确性。
-
公开(公告)号:CN119003744A
公开(公告)日:2024-11-22
申请号:CN202411487039.0
申请日:2024-10-24
Applicant: 烟台海颐软件股份有限公司
IPC: G06F16/332 , G06F16/33 , G06F16/38 , G06F40/186 , G06F40/226
Abstract: 本发明属于电力数据治理技术领域,具体涉及一种基于KCMAP的电力数据治理可信规划工作流方法,包括:面向电力数据治理设计知识组织结构并构建领域知识库且向量化存储;设计多阶知识prompt构建DR‑RAG模型从向量库中检索知识片段并利用LLM合成领域流程;设计知识能力匹配智能体,将领域流程知识与可用智能体基于智能体能力规约进行匹配,并修正领域流程知识;设计任务可信规划智能体,对电力数据治理作业基于领域知识流程进行分解和规划,生成任务计划;设计两阶段验证机制,确保任务计划的合理性与调度执行的准确性。
-
公开(公告)号:CN117763305A
公开(公告)日:2024-03-26
申请号:CN202311729543.2
申请日:2023-12-15
Applicant: 烟台海颐软件股份有限公司
IPC: G06F18/20 , G06F18/232 , G06F18/243 , G06N3/0442
Abstract: 本发明公开了一种计及行为共性的电力时序数据异常检测与修复方法,包括如下步骤:根据电力时序数据进行行为共性分析,获取到电力时序数据的群体聚类结果;根据电力时序数据计算时序异常得分,生成所有数据的异常得分集合;根据聚类结果和异常得分集合,进行计及行为共性的电力时序数据异常识别;根据异常识别结果和聚类结果,进行计及行为共性的电力时序数据异常修复。本发明从行为共性分析、时序异常评估、异常值修复三方面提出了创新性方案,有效提高了对于电力时序数据的异常检测与修复的准确度,解决了现有方法难以精准识别异常并修复的问题,这一完整流程对电力系统中的智能数据治理具有重要意义。
-
公开(公告)号:CN116128544A
公开(公告)日:2023-05-16
申请号:CN202211642952.4
申请日:2022-12-20
Applicant: 烟台海颐软件股份有限公司
IPC: G06Q30/0201 , G06Q30/0202 , G06Q50/06 , G06F18/214 , G06F18/2431 , G06N20/00
Abstract: 本发明公开了一种电力营销异常营业数据的主动稽核方法和系统,所述方法包括:计算给定待稽核数据中各分类属性间的信息增益率,分析分类属性业务关联;基于分类属性间的相关性分析结果,对存在显著相关性的属性进行拼接,形成新的混合数据;基于新的混合数据,对分类属性进行频数特征变换,生成能够直接输入模型训练的属性特征数据;基于属性特征数据,以增强孤立森林算法为基础构建并训练增强孤立森林模型;以训练好的增强孤立森林模型为基础,计算电力营销营业数据的异常评分;基于电力营销营业数据的异常评分,自适应判别异常群体,得到自适应异常结果;根据输出的自适应异常结果,将其与电力营销营业数据相结合,输出最终的异常判别结果。
-
公开(公告)号:CN119166662B
公开(公告)日:2025-05-16
申请号:CN202411666549.4
申请日:2024-11-21
Applicant: 烟台海颐软件股份有限公司
IPC: G06F16/242 , G06F16/31 , G06F16/332 , G06F16/334 , G06F40/295 , G06N5/025
Abstract: 本发明属于电力领域的数据查询技术领域,具体涉及一种基于KMDI链的电力领域SQL智能体构建方法。该方法基于电力领域的数据结构、数据编码以及数据关系等专业知识构建多种领域知识库,通过设计知识匹配与决策、关键知识蒸馏以及关键知识注入等三个环节组成的链式流程并构建SQL智能体,以在大语言模型的支持下实现自然语言提问中电力专业术语的数据编码转换,并准确生成与需求相适配的数据查询SQL语句,使电力领域业务人员可以直接通过自然语言实现数据的访问和操作。
-
-
-
-
-
-
-
-
-