-
公开(公告)号:CN118733706A
公开(公告)日:2024-10-01
申请号:CN202410838596.6
申请日:2024-06-26
Applicant: 国网智能电网研究院有限公司 , 国网江苏省电力有限公司无锡供电分公司 , 国家电网有限公司
IPC: G06F16/33 , G06F16/332 , G06Q50/06
Abstract: 本申请涉及机器学习技术领域,提供基于检索增强的电力标准问答模型训练方法及系统。所述方法包括:基于大数据采集电力领域数据,构建电力标准文档;构建问答数据库;训练检索模型;训练答复模型;联合优化检索与答复模型,生成联合优化结果;构建初始问答模型,回溯训练并输出电力标准问答模型。本申请解决了现有电力标准问答模型采用基于规则或模板的方法,导致缺乏灵活性和泛化能力,难以应对电力标准文档的复杂性和多样性,进而在理解和解析文档时容易出现偏差或误解,使得回答不准确的技术问题,实现了基于输入文本的语义相似度,利用的问答模型,对电力标准知识的精准高效匹配,提高电力标准问答模型的准确性、专业性和可靠性的效果。
-
公开(公告)号:CN117668183A
公开(公告)日:2024-03-08
申请号:CN202311617146.6
申请日:2023-11-29
Applicant: 国网智能电网研究院有限公司
IPC: G06F16/332 , G06F16/31 , G06N20/00 , G06F16/33
Abstract: 本发明涉及人工智能技术领域,公开了一种电力专用插件构建以及电力设备检索问答方法,电力专用插件构建方法包括:获取预训练模型以及训练数据;使用预训练模型初始化检索模型和重排模型;采用分步迭代优化方法基于训练数据对检索模型和重排模型进行联合训练;使用联合训练后的检索模型和重排模型构建电力专用插件。本发明采用分步迭代优化方法联合训练检索模型和重排模型,使用训练后的检索模型和重排模型构建电力专用插件构建,采用插件化的方式将该电力专用插件与大语言模型结合,实现了为大语言模型补充电力专业知识的目的,达到了将传统电力领域任务与大语言模型相结合的效果,解决了大语言模型缺乏电力领域专业知识的问题。
-
公开(公告)号:CN118428365A
公开(公告)日:2024-08-02
申请号:CN202410475675.5
申请日:2024-04-19
Applicant: 国网智能电网研究院有限公司 , 国网山东省电力公司电力科学研究院 , 国家电网有限公司
IPC: G06F40/295 , G06V10/40 , G06V10/44 , G06F18/213 , G06F18/25 , G06N3/0455 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本发明涉及多模态信息抽取技术领域,具体提供了一种基于深度神经网络的电力设备命名实体识别方法及装置,包括:获取电力设备新闻报道的文本数据和图像数据;将所述文本数据作为预先构建的多模态命名实体识别模型中的BERT模型的输入,将所述图像数据作为预先构建的多模态命名实体识别模型中的分层视觉特征提取模型的输入,得到预先构建的多模态命名实体识别模型输出的电力设备新闻报道的命名实体识别结果。本发明提供的技术方案,能够提高电力设备新闻报道信息抽取的准确性,实现将非结构化文本数据准确转化为知识,进而帮助完善智慧电网建设,支撑电力设备态势感知与舆情风险预警等监管工作。
-
公开(公告)号:CN118733706B
公开(公告)日:2025-01-24
申请号:CN202410838596.6
申请日:2024-06-26
Applicant: 国网智能电网研究院有限公司 , 国网江苏省电力有限公司无锡供电分公司 , 国家电网有限公司
IPC: G06F16/334 , G06F16/3331 , G06F16/332 , G06Q50/06
Abstract: 本申请涉及机器学习技术领域,提供基于检索增强的电力标准问答模型训练方法及系统。所述方法包括:基于大数据采集电力领域数据,构建电力标准文档;构建问答数据库;训练检索模型;训练答复模型;联合优化检索与答复模型,生成联合优化结果;构建初始问答模型,回溯训练并输出电力标准问答模型。本申请解决了现有电力标准问答模型采用基于规则或模板的方法,导致缺乏灵活性和泛化能力,难以应对电力标准文档的复杂性和多样性,进而在理解和解析文档时容易出现偏差或误解,使得回答不准确的技术问题,实现了基于输入文本的语义相似度,利用的问答模型,对电力标准知识的精准高效匹配,提高电力标准问答模型的准确性、专业性和可靠性的效果。
-
公开(公告)号:CN119067233A
公开(公告)日:2024-12-03
申请号:CN202411034052.0
申请日:2024-07-30
Applicant: 国网智能电网研究院有限公司
IPC: G06N20/00 , G06F18/214 , G06F18/241 , G06F16/35
Abstract: 本发明属于机器学习技术领域,公开了一种专业领域文本大模型的多阶段预训练方法及相关装置;其中,所述多阶段预训练方法包括:基于获取的全量数据,采用混合随机采样的方式对待预训练的文本大模型进行预设轮次的训练,获得一次训练后的文本大模型;对全量数据进行分批次采样,并计算获得各批次采样数据对应的交叉熵损失,基于各批次采样数据对应的交叉熵损失对全量数据进行难度分类,获得各个预设难度等级的预训练数据集;基于各个预设难度等级的预训练数据集,对一次训练后的文本大模型进行由易到难的分阶段预训练,获得多阶段预训练后的专业领域文本大模型。本发明技术方案训练获得的文本大模型具有更好的测试结果以及更好的模型鲁棒性。
-
公开(公告)号:CN116227496B
公开(公告)日:2023-07-14
申请号:CN202310498522.8
申请日:2023-05-06
Applicant: 国网智能电网研究院有限公司 , 国网江苏省电力有限公司 , 国家电网有限公司
IPC: G06F40/295 , G06F40/30 , G06F16/35 , G06N3/0442 , G06N3/0455 , G06N3/048 , G06N3/08 , G06F18/25 , G06Q50/06
Abstract: 本发明涉及自然语言处理技术领域,具体提供了一种基于深度学习的电力舆情实体关系抽取方法及系统,包括:将电力舆情文本作为预先构建的关系抽取模型的输入,得到所述预先构建的关系抽取模型输出的电力舆情文本的关系特征标注结果;获取电力舆情文本的属性特征,并将所述属性特征和关系特征标注结果作为预先构建的实体关系抽取模型的输入,得到所述预先构建的实体关系抽取模型输出的电力舆情文本的实体关系标注结果。本发明提供的技术方案,可以有效的从电力舆情文本中自动的将包含的实体内容与实体之间的关系抽取出来。
-
公开(公告)号:CN115730071A
公开(公告)日:2023-03-03
申请号:CN202211495906.6
申请日:2022-11-23
Applicant: 国网智能电网研究院有限公司 , 国网江苏省电力有限公司 , 国家电网有限公司
IPC: G06F16/35 , G06F40/30 , G06F18/214
Abstract: 本发明实施例涉及一种电力舆情事件的抽取方法、装置、电子设备及存储介质,包括:获取电力舆情数据;对所述电力舆情数据进行事件检测,标注含有事件类型标签的目标语句;抽取所述目标语句中的论元角色;将所述目标语句对应的事件类型与抽取到的论元角色按照预设格式组合,得到电力舆情事件。由此,可以从大量的电力舆情文本中自动、快捷的将其包含的多个事件信息同时抽取出来,提高了电力舆情事件的识别准确率和抽取效率。
-
公开(公告)号:CN119759917A
公开(公告)日:2025-04-04
申请号:CN202411636548.5
申请日:2024-11-15
Applicant: 国网智能电网研究院有限公司 , 中国电力科学研究院有限公司 , 国家电网有限公司
Abstract: 一种基于本体依赖关系的产品资料图谱动态更新方法及系统,方法包括定义依赖实体和依赖关系,并建立产品资料依赖关系图;基于产品资料依赖关系图,根据依赖关系的属性键连接添加实体与其他实体的关系,根据依赖关系添加属性键和其依赖实体,连接实体与依赖实体的关系;搜索依赖实体与其他实体之间的关系,找出关联的依赖实体;完成产品资料图谱自动化添加;基于产品资料依赖关系图,将待删除的实体放入队列中,每次将相邻的依赖实体送入队列中,并依赖边入度确定相应实体是否需要删除;完成产品资料图谱自动化删除。本发明减少了运维人员对图谱更新逻辑维护的工作量,能适应图谱规模变化,最大可能减少因本体增减导致的对每个实体更新逻辑的修改。
-
公开(公告)号:CN119357594A
公开(公告)日:2025-01-24
申请号:CN202411896316.3
申请日:2024-12-23
Applicant: 国网江苏省电力有限公司 , 国网江苏省电力有限公司南通供电分公司 , 国网智能电网研究院有限公司 , 中国电力科学研究院有限公司 , 苏州华天国科电力科技有限公司
IPC: G06F18/20 , G06Q50/06 , G06F18/213 , G06N3/0455 , G06F18/10 , G06N3/084 , G06F17/16 , G06F17/18
Abstract: 本发明涉及一种基于大规模语言模型的电力时间序列预测方法、系统、终端及其存储介质,其特征在于,所述方法包括以下步骤:采集电力时间序列,利用自适应分解模块将所述电力时间序列分解为季节项序列和趋势项序列;采用实例正则化和分片化,分别对所述季节项序列和趋势项序列进行运算,以获得季节数据和趋势数据;将季节数据和趋势数据拼接并映射后,输入至预训练后的GPT模型中,输出所述电力时间序列的预测量。本发明设计了一种新的泛用的时间序列大规模语言模型,有效可靠、分析结果准确,在参数训练上简单易行。
-
公开(公告)号:CN119127921A
公开(公告)日:2024-12-13
申请号:CN202411014302.4
申请日:2024-07-26
Applicant: 国网智能电网研究院有限公司 , 国网江苏省电力有限公司南通供电分公司 , 国网江苏省电力有限公司 , 国家电网有限公司
IPC: G06F16/2452 , G06F16/2455 , G06F16/248 , G06N3/045 , G06N3/0895 , G06N3/042 , G06N3/043
Abstract: 一种电力设备数据智能交互方法、系统、设备及介质,包括:基于用户输入的查询信息进行数据库表信息检索,得到数据库表信息;基于查询信息进行电力设备知识库检索,得到业务知识计算逻辑和上下文学习示例;基于数据库表信息、业务知识计算逻辑和上下文学习示例创建提示,并将提示输入到大模型中生成数据库语句;运行数据库语句并判定是否成功,若成功则输出查询结果;否则进行错误校正,得到校正后的数据库语句并重新运行;数据库表信息检索可以实现对用户查询进行表字段链接、表主外键、表关联关系的抽取,提升模型生成数据库语言的准确率和性能,降低数据查询门槛,提高数据利用效率;电力设备知识库可以实现业务知识注入的灵活与可扩展性。
-
-
-
-
-
-
-
-
-