-
公开(公告)号:CN112257416A
公开(公告)日:2021-01-22
申请号:CN202011175920.9
申请日:2020-10-28
Applicant: 国家电网有限公司客户服务中心 , 北京数洋智慧科技有限公司
IPC: G06F40/216 , G06F40/284 , G06F40/289
Abstract: 本发明涉及一种稽查新词发现方法,所述方法包括:首先用n‑gram算法模型进行分词,根据阈值过滤掉词频较小的候选词;然后计算候选词的互信息和左右邻接熵,提取候选词词性组合特征,并选用随机森林算法构建模型对特征指标进行训练测试,确保新词的准确性;最后在词性过滤之后,引入bloom filter算法提高匹配效率,最终输出新词发现模型结果。本发明提供的方案,可以帮助分析人员快速、准确发现稽查工单中出现的新词,构建稽查全专业基础词库,支撑工单文本分类识别,提高中心稽查工单分析能力。
-
公开(公告)号:CN116882912A
公开(公告)日:2023-10-13
申请号:CN202310647462.1
申请日:2023-06-01
Applicant: 国家电网有限公司客户服务中心
IPC: G06Q10/10 , G06Q50/06 , G06F40/284 , G06F40/186 , G06F40/247
Abstract: 本发明涉及电力稽查系统技术领域,具体为一种稽查新词识别系统及方法,一种稽查新词识别系统是由电力稽查系统、录入项识别系统、稽查录入系统组成,电力稽查系统的输出端与录入项识别系统、稽查录入系统的输入端通讯连接。本发明中,通过电力稽查系统的运作,进行不间断数据收录以及稽查工作,并分配巡检任务给稽查录入系统的各移动端口,以此录入关键内容,并在新词识别单元中,通过词汇录入单元搭载手动录入组件、导入组件、自动化生成组件,以此达成手动录入新词、通过文件导入新词以及基于关键内容自动化生成新词的效果,对同义词进行识别并比对参照的同时,也达成了新词的多维度识别功能,进而确保了数据录入工作的快捷性以及全面性特征。
-
公开(公告)号:CN117390561A
公开(公告)日:2024-01-12
申请号:CN202311215492.1
申请日:2023-09-19
Applicant: 国家电网有限公司客户服务中心
IPC: G06F18/2433 , G06F18/213 , G06F18/2415 , G06F16/2458 , G06N3/045 , G06N3/047
Abstract: 本申请公开了一种基于人工智能的电力稽查方法、装置以及存储介质。其中,一种基于人工智能的电力稽查方法,包括:获取预设的采样统计周期中的用户家庭的用电量信息,根据用电量信息确定与各个电器的用电量对应的正态分布;根据正态分布确定预设的监控周期内用户家庭的用电信息对应的概率特征;对监控周期内监控时间窗中的概率特征进行特征提取,生成与监控时间窗对应的用电数据特征;以及根据用电数据特征确定与监控时间窗对应的用电异常信息。
-
公开(公告)号:CN119271657A
公开(公告)日:2025-01-07
申请号:CN202411783423.5
申请日:2024-12-06
Applicant: 北京数洋智慧科技有限公司
IPC: G06F16/215 , G06F40/30 , G06F40/253 , G06F40/295 , G06N3/0442 , G06N3/0455 , G06F16/35
Abstract: 本申请提供一种基于大数据分析的数据质量评估方法及系统。其中,接收来自不同数据源的实时数据,实时数据包含结构化数据和非结构化数据;对非结构化数据进行意义解析处理,得到实时数据的业务语境;通过智能算法对实时数据的完整性和一致性进行确定处理,得到实时数据的完整性和一致性评估结果;基于逻辑关系的评估结果,结合完整性和一致性评估结果,构建数据质量评价模型,数据质量评价模型用于量化实时数据的准确性和时效性;生成数据质量报告,并根据数据质量报告,提出业务改进措施;根据业务改进措施,优化数据采集和处理流程。本申请提供的技术方案能够提升数据质量评估的灵活性和效率,并且能够更好地支持企业的实时数据分析需求。
-
公开(公告)号:CN119168075A
公开(公告)日:2024-12-20
申请号:CN202411667978.3
申请日:2024-11-21
Applicant: 北京数洋智慧科技有限公司
Abstract: 本申请提供一种AI大数据实时处理与分析方法及系统,其中,获取来自不同数据源的实时数据流,并将所述实时数据流映射至预设的数据结构框架内获得初始数据流,通过实时数据融合引擎融合处理初始数据流,得到目标实时数据流,再利用数据挖掘和机器学习算法对目标实时数据流进行模式识别与趋势分析处理,生成目标洞察报告,利用智能决策单元优化处理目标洞察报告,生成策略信息并执行,得到最佳分析结果,本申请提供的技术方案不仅解决了多源异构数据的集成和融合问题,还提高了数据分析的实时性和准确性,实现了从数据到决策的高效转换,显著提升了业务流程的智能化水平和响应速度。
-
公开(公告)号:CN115906954A
公开(公告)日:2023-04-04
申请号:CN202211585225.9
申请日:2022-12-09
Applicant: 北京数洋智慧科技有限公司
IPC: G06N3/049 , G06N3/0442 , G06N3/048 , G06N3/08
Abstract: 本发明公开了一种基于图神经网络的多变量时间序列预测方法及装置,收集预测内容及相关特征的历史数据,进行数据预处理得到预测数据集,并划分训练集、验证集、测试集;根据所述训练集追踪每个数据特征作为图结构的一个节点,构建图结构数据;根据所述图结构数据,构建图神经网络;根据图神经网络对所述训练集、验证集及测试集对所述图神经网络进行测试验证,并调整相关超参数,优化所述图神经网络得到最佳模型;根据所述最佳模型对多变量时间序列进行预测。本发明方案结合多变量时间序列数据的时空关联特性,使用图神经网络去预测未来时刻的结果,结合图神经网络对于节点与边之间强大的表征关系解决预测问题,提升模型预测效果。
-
公开(公告)号:CN115840893A
公开(公告)日:2023-03-24
申请号:CN202211602472.5
申请日:2022-12-09
Applicant: 北京数洋智慧科技有限公司
IPC: G06F18/214 , G06N3/084 , G06N3/044 , G06N3/0464
Abstract: 本发明公开了一种多变量时间序列预测方法及装置,收集预测内容及相关特征的历史数据,进行数据预处理得到预测数据集,并构建可变滑动窗口数据集;将所述预测数据集放入transformer encoder作为特征提取器组成的模型结构中,训练模型;调整模型参数及调节模型超参数,得到最优模型;根据所述最优模型对待预测内容进行预测。本发明方案结合多变量时间序列预测的特点,和门控循环单元结合起来,能捕捉到时间步上特征间的关系,更好地把握时间维度的特征,提升模型预测效果。
-
公开(公告)号:CN119202000A
公开(公告)日:2024-12-27
申请号:CN202411698744.5
申请日:2024-11-26
Applicant: 北京数洋智慧科技有限公司
IPC: G06F16/2455 , G06F16/27
Abstract: 本申请提供一种基于大数据的信息收集分析方法及系统。其中,自动识别并抓取多元异构数据源的相关数据;对相关数据进行实时流式处理,依据相关数据的时间序列特性与事件关联性构建信息图谱;利用图论算法及机器学习技术对信息图谱中的节点进行重要性评估,得到节点重要性评分,并基于节点重要性评分确定出信息图谱中的关键信息节点与潜在的信息孤岛;基于关键信息节点与潜在的信息孤岛的节点重要性评分,优化当前信息检索策略,得到优化后的信息检索策略;根据优化后的信息检索策略调整多元异构数据源的选择以及优先级排序,并反馈至信息收集引擎。本申请提供的技术方案提高了信息收集与处理的效率、精度和智能化水平。
-
公开(公告)号:CN118568781B
公开(公告)日:2024-10-29
申请号:CN202411052633.7
申请日:2024-08-02
Applicant: 北京数洋智慧科技有限公司
Abstract: 本申请公开了基于隐私计算的数据开放方法、装置及存储介质。其中,方法包括:响应于用户的数据隐私配置操作,将与数据隐私配置操作对应的数据的隐私配置信息进行上链操作,并存储于与区块链系统对应的区块链数据;确定与用户输入的数据处理指令对应的计算任务,并且生成与计算任务对应的第一节点图;从区块链数据获取分别与各个计算节点对应的开放数据的隐私配置信息;根据与开放数据对应的隐私配置信息,生成与第一节点图对应的第二节点图,其中第二节点图包括第一子图和第二子图;以及根据第二节点图从区块链系统获取与各个子图相应的开放数据,并且实施与各个子图对应的计算过程。从而能够达到大大提高计算的效率的技术效果。
-
公开(公告)号:CN108052500B
公开(公告)日:2021-06-22
申请号:CN201711332910.X
申请日:2017-12-13
Applicant: 北京数洋智慧科技有限公司
IPC: G06F40/30 , G06F40/289 , G06F40/284
Abstract: 本发明公开了一种基于语义分析的文本关键信息提取方法及装置,不限制搭配成词的原词语数目,用以发现文本中可表征明确含义的候选字符串,解决了词典依赖及只能提取词语的问题。相对于传统的权重计算方法,通过分析文本特点,发现上下文语义信息丰富度可以反映出字符串表达意图能力的强弱,因此,在字符串权重计算公式中加入外部丰富度影响因子,不仅考虑了字符串本身特点,也考虑了字符串外部上下文的环境,有效地补充了指标体系,提高了结果准确性。
-
-
-
-
-
-
-
-
-