-
公开(公告)号:CN113240010A
公开(公告)日:2021-08-10
申请号:CN202110528743.6
申请日:2021-05-14
Applicant: 烟台海颐软件股份有限公司
IPC: G06K9/62
Abstract: 本发明涉及结构化数据异常检测领域,具体涉及一种支持非独立分布混合数据的异常检测方法及系统。包括元数据管理模块,数据集成模块,数据管理模块,任务管理与调度模块,数据关联模块,特征变换模块,模型训练模块,异常评估模块,结果管理模块。基于本算法构建的系统可以适用于结构化混合数据、单纯的分类数据、单纯的数值型数据三种不同目的智能化异常检测,可以极大的提升异常检测的效率和普适性,尤其是在数据治理、工业异常检测应用中。
-
公开(公告)号:CN117743938B
公开(公告)日:2025-01-28
申请号:CN202311785567.X
申请日:2023-12-22
Applicant: 烟台海颐软件股份有限公司
IPC: G06F18/241 , G06F18/213 , G06F18/232 , G06N3/0455
Abstract: 本发明属于数据治理技术领域,具体涉及一种不均衡数据的异常识别与修复方法及系统。所述方法包括不均衡混合数据聚类分析、异常数据识别与特征定位、异常数据修复三部分内容,首先提出了基于代价优化的混合聚类算法,解决不均衡数据集下混合数据的有效聚类问题,实现同一聚类簇内数据具有高度相似性;其次提出一种基于孤立森林的异常特征定位算法,解决以往无监督异常检测算法仅能定位到异常记录而无法识别记录中具体异常特征的问题,实现问题数据的准确定位;最后提出基于异构变分自编码器的数据修复模型,实现对混合数据异常的可信修复,解决以往人工智能方法在数据修复过程中受数据分布和噪声数据干扰过大导致修复数据可信度不高的问题。
-
公开(公告)号:CN117933364B
公开(公告)日:2024-06-04
申请号:CN202410315687.1
申请日:2024-03-20
Applicant: 烟台海颐软件股份有限公司
Abstract: 本发明属于电力行业自然语言处理技术领域,具体涉及基于跨语言知识迁移和经验驱动的电力行业模型训练方法。本发明针对现有行业大模型的局限,提出一种两阶段训练方法。第一阶段为跨语言迁移的增量预训练:利用不同语种语料对开源模型进行增量预训练,可扩大模型知识范围,强化模型记忆程度;第二阶段为专家经验驱动的指令微调训练:充分利用专家业务经验指导教师模型生成符合实际的任务指令样本,并利用这些指令样本对模型进行微调训练;该方法既用到了专家的经验,又“蒸馏”了教师模型自身的知识能力,可以使模型更好地理解和执行电力领域特定任务,有助于提高模型行业应用的可靠性。
-
公开(公告)号:CN115809274A
公开(公告)日:2023-03-17
申请号:CN202211629856.6
申请日:2022-12-19
Applicant: 烟台海颐软件股份有限公司
IPC: G06F16/2455 , G06F16/23 , G06Q50/06
Abstract: 本发明属于电力系统技术领域,具体涉及一种电力量价费一致性核查规则挖掘方法与系统。所述方法包括:获取核查数据集,计算量价费数据的等价分划;使用深度优先空间搜索策略挖掘数据一致性关系,得到数据中的一致性关系集合;利用得到的一致性关系集合,对量价费一致性关系进行规则解析;通过规则解析,识别出在量价费数据中的罕见数据。本发明将一种新的针对分类型数据的一致性规则挖掘方法应用在电力量价费数据的核查工作中,能主动挖掘出数据中的潜在规则,良好地弥补了以往人工定义规则存在工作量大、耗时长、规则覆盖面不足、只能发现被定义规则覆盖的业务异常数据等短板,辅助业务人员更智能、更全面地完成电力营销量价费数据核查工作。
-
公开(公告)号:CN115271215A
公开(公告)日:2022-11-01
申请号:CN202210913740.9
申请日:2022-07-29
Applicant: 烟台海颐软件股份有限公司
Abstract: 本发明公开了一种短期电力负荷精细修正预测方法、系统、装置、介质,方法包括:利用训练好的平均负荷集成模型,对预测日每一段的平均负荷进行预测,得到预测日每一段的平均负荷的预测结果;利用训练好的时刻点负荷集成模型,对预测日各时刻点的负荷值进行预测,得到各时刻点初期的负荷预测结果;利用预测日每一段的平均负荷的预测结果对相应的预测日的初期负荷预测结果进行修正,得到预测日各时刻点的最终预测负荷结果。与人工确定系数相比,该修正方法更具有可解释性、智能性、降低了人工干预,对预测结果的修正更加精细准确。
-
公开(公告)号:CN114095375A
公开(公告)日:2022-02-25
申请号:CN202111359067.0
申请日:2021-11-16
Applicant: 烟台海颐软件股份有限公司
Abstract: 本发明公开了一种网络拓扑算法,判断父节点模型属性,获取预生成位置的集合,遍历剩余位置,判断扩展方向,在预生成位置创建新的模型,建立父子节点模型关系;判断网络拓扑的大小是否合适,若不合适则调整网络拓扑大小;判断网络拓扑的位置是否合适,若不合适则调整网络拓扑位置;创建连线,将拥有相同父节点的节点模型连接。本发明面向离散制造企业,自定义生成网络拓扑,仿真离散制造企业现场网络环境,并可于网络拓扑上配置安全规则及报文,模拟工控现场安全策略及威胁事件的发生,通过安全检测过滤,展示告警信息,为企业制定合理的安全策略及工控安全产品提供依据。本发明还公开了一种工控安全仿真方法及系统。
-
公开(公告)号:CN116128544B
公开(公告)日:2024-12-10
申请号:CN202211642952.4
申请日:2022-12-20
Applicant: 烟台海颐软件股份有限公司
IPC: G06Q30/0201 , G06Q30/0202 , G06Q50/06 , G06F18/214 , G06F18/2431 , G06N20/00
Abstract: 本发明公开了一种电力营销异常营业数据的主动稽核方法和系统,所述方法包括:计算给定待稽核数据中各分类属性间的信息增益率,分析分类属性业务关联;基于分类属性间的相关性分析结果,对存在显著相关性的属性进行拼接,形成新的混合数据;基于新的混合数据,对分类属性进行频数特征变换,生成能够直接输入模型训练的属性特征数据;基于属性特征数据,以增强孤立森林算法为基础构建并训练增强孤立森林模型;以训练好的增强孤立森林模型为基础,计算电力营销营业数据的异常评分;基于电力营销营业数据的异常评分,自适应判别异常群体,得到自适应异常结果;根据输出的自适应异常结果,将其与电力营销营业数据相结合,输出最终的异常判别结果。
-
公开(公告)号:CN114095375B
公开(公告)日:2024-03-15
申请号:CN202111359067.0
申请日:2021-11-16
Applicant: 烟台海颐软件股份有限公司
Abstract: 本发明公开了一种网络拓扑算法,判断父节点模型属性,获取预生成位置的集合,遍历剩余位置,判断扩展方向,在预生成位置创建新的模型,建立父子节点模型关系;判断网络拓扑的大小是否合适,若不合适则调整网络拓扑大小;判断网络拓扑的位置是否合适,若不合适则调整网络拓扑位置;创建连线,将拥有相同父节点的节点模型连接。本发明面向离散制造企业,自定义生成网络拓扑,仿真离散制造企业现场网络环境,并可于网络拓扑上配置安全规则及报文,模拟工控现场安全策略及威胁事件的发生,通过安全检测过滤,展示告警信息,为企业制定合理的安全策略及工控安全产品提供依据。本发明还公开了一种工控安全仿真方法及系统。
-
公开(公告)号:CN117454188A
公开(公告)日:2024-01-26
申请号:CN202311095887.2
申请日:2023-08-29
Applicant: 烟台海颐软件股份有限公司
IPC: G06F18/22 , G06F40/30 , G06F40/216 , G06F40/289
Abstract: 本发明公开了一种基于标准数据元的多策略数据治理规则适配方法及系统,该方法包括:数据准备;进行字段定义匹配;进行特殊字段匹配;进行语义相似度匹配,根据LCS相似度和余弦相似度完成语义相似度匹配;进行编码信息匹配;进行算法匹配结果推荐;进行推荐结果审核研判;输出最终匹配结果。本发明通过在系统中引入“标准数据元”的概念,建立数据元与标准数据元间的映射关系,并结合标准数据元与通用规则、标准参考数据之间的映射关系,实现数据元与通用规则、标准参考数据的自动绑定,生成数据标准规则,从而实现数据元与标准规则的适配。
-
公开(公告)号:CN117131449A
公开(公告)日:2023-11-28
申请号:CN202311087471.6
申请日:2023-08-28
Applicant: 烟台海颐软件股份有限公司
IPC: G06F18/2433 , G06F18/2415 , G06F18/23213 , G06F18/214 , G06F18/15 , G06N3/0895
Abstract: 本发明公开了一种面向数据治理的具有传播学习能力的异常识别方法及系统,该方法包括:配置文件加载,读取待检测数据,且区分为数值型字段和分类型字段;对待检测数据进行预处理,获取到采样区间和初始标签;根据采样区间进行数据采样,结合交互标记操作,训练字段级异常分类器与记录级异常分类器;利用训练好的字段级异常分类器和记录级异常分类器分别对待检测数据进行字段级异常识别和记录级异常识别,输出异常数据。本发明依据采样算法抽取有代表性的数据,通过系统中集成的用户交互模块对数据进行标注,通过标签传播扩展标签数量,大幅减少所需标签数据的数量,训练有监督的分类模型并结合主动学习提升混合数据异常识别的准确性。
-
-
-
-
-
-
-
-
-