-
公开(公告)号:CN117610537A
公开(公告)日:2024-02-27
申请号:CN202311413683.9
申请日:2023-10-27
Applicant: 国网山东省电力公司信息通信公司 , 北京大学
Abstract: 本发明涉及自然语言处理技术领域,提供了基于核范数和图神经网络的情感因果关系抽取方法及系统,包括:获取文本;基于所述文本,通过情感因果关系抽取模型,得到文本中的情感和原因句子对;所述情感因果关系抽取模型在提取到所述文本中每个子句的初始隐状态表示后,使用图注意力网络进行子句之间的交互,得到每个子句的隐状态表示,并基于所述隐状态表示,预测出情感子句和原因子句,将所有的情感子句和原因子句两两组合为情感和原因句子对,并预测每个情感和原因句子对的概率,抽取出概率满足条件的情感和原因句子对;其中,情感因果关系抽取模型通过二元交叉熵和核范数组成的损失函数进行训练。提高了因果关系抽取的效果。
-
公开(公告)号:CN113157860B
公开(公告)日:2022-03-11
申请号:CN202110370413.9
申请日:2021-04-07
Applicant: 国网山东省电力公司信息通信公司 , 北京大学 , 南瑞集团有限公司
IPC: G06F16/33 , G06F16/36 , G06F40/289 , G06F40/242 , G06F40/216
Abstract: 本发明公布了一种基于小规模数据的电力设备检修知识图谱构建方法,包括以下步骤:爬取知识百科网站,构建电力基础语料数据集,所述电力基础语料数据集中至少包括检修手册和根据检修手册中的基础词汇爬取的百科知识;根据所述电力基础语料数据集和通用词典,统计词频构建电力领域主题词典;根据所述电力基础语料文档数据集,生成电力语义词向量转换模型,并根据所述转换模型计算所述检修手册中的基础词汇和所述百科知识的语义相似度;判断所述语义相似度是否大于阈值,如果是,则建立所述检修手册和所述百科知识之间的语义关联关系,构建知识图谱。本发明的方法可以满足故障原因查询、处理措施检索和相关知识参考的场景。
-
公开(公告)号:CN117634466A
公开(公告)日:2024-03-01
申请号:CN202311220009.9
申请日:2023-09-20
Applicant: 国网山东省电力公司信息通信公司 , 国网山东省电力公司 , 北京大学
IPC: G06F40/211 , G06F40/289 , G06N3/048 , G06F18/241
Abstract: 本发明属于信息抽取领域,提供基于连接词增强的双流情感因果关系抽取方法及系统。其中,基于连接词增强的双流情感因果关系抽取方法包括对文本进行编码,得到文本中各个子句的隐状态表示;抽取出所有情感句和原因句;构建第一句对集合以及第二句对集合;得到各个集合对应的每个连接词及其隐状态表示;将第一句对集合中各个子句的隐状态表示与连接词的隐状态表示连接,得到句子对第一隐状态表示;将第二子句对集合中各个子句的隐状态表示与连接词的隐状态表示连接,得到句子对第二隐状态表示;根据句子对第一隐状态表示和句子对第二隐状态表示分别与句子对的映射关系,对应抽取出情感‑原因句子对以及原因‑情感句子对,确定出双流情感因果关系。
-
公开(公告)号:CN117332783A
公开(公告)日:2024-01-02
申请号:CN202311219833.2
申请日:2023-09-20
Applicant: 国网山东省电力公司信息通信公司 , 国网山东省电力公司 , 北京大学
IPC: G06F40/295 , G06F18/214 , G06F40/211
Abstract: 本发明公开一种基于重排序的命名实体识别方法、系统、设备及存储介质,涉及命名实体数据识别技术领域,包括:对文本训练集采用预构建的命名实体识别模型得到候选识别结果;对候选识别结果根据预设的标准答案计算F1分值,并按照F1分值对候选识别结果排序;对排序后的候选识别结果定义对比学习损失函数,以此对预构建的命名实体识别模型进行训练;对待处理文本采用训练后的命名实体识别模型,得到目标实体词的分类识别结果。提高命名实体识别效果。
-
公开(公告)号:CN113157860A
公开(公告)日:2021-07-23
申请号:CN202110370413.9
申请日:2021-04-07
Applicant: 国网山东省电力公司信息通信公司 , 北京大学 , 南瑞集团有限公司
IPC: G06F16/33 , G06F16/36 , G06F40/289 , G06F40/242 , G06F40/216
Abstract: 本发明公布了一种基于小规模数据的电力设备检修知识图谱构建方法,包括以下步骤:爬取知识百科网站,构建电力基础语料数据集,所述电力基础语料数据集中至少包括检修手册和根据检修手册中的基础词汇爬取的百科知识;根据所述电力基础语料数据集和通用词典,统计词频构建电力领域主题词典;根据所述电力基础语料文档数据集,生成电力语义词向量转换模型,并根据所述转换模型计算所述检修手册中的基础词汇和所述百科知识的语义相似度;判断所述语义相似度是否大于阈值,如果是,则建立所述检修手册和所述百科知识之间的语义关联关系,构建知识图谱。本发明的方法可以满足故障原因查询、处理措施检索和相关知识参考的场景。
-
公开(公告)号:CN118520378A
公开(公告)日:2024-08-20
申请号:CN202410985098.4
申请日:2024-07-23
Applicant: 国网山东省电力公司信息通信公司 , 国网智能电网研究院有限公司
Inventor: 孙岗 , 田鹏 , 严莉 , 曲延盛 , 王晓慧 , 刘同阳 , 张强 , 呼海林 , 牛德玲 , 杨坤 , 肖沈阳 , 朱尤祥 , 李明 , 李宁 , 张金国 , 胡斌浩 , 王雨晨 , 刘保臣 , 孟祥鹿
IPC: G06F18/243 , G06F18/214 , G06N20/20 , G06N5/01
Abstract: 本发明提供了一种基于集成学习的电力数据分类分级方法及系统,涉及电力数据处理技术领域,该方法包括:结合预处理模型进行源端电力数据的预处理,确定电力数据集;遍历电力数据集筛选关键特征,以特征稳定度与普适度为基准进行特征转换,确定有效数据特征;基于有效数据特征与电力数据集训练数据分类器,基于数据分级规则训练数据分级器,构成数据划分模型;结合数据划分模型执行横向分类与纵向分级处理,确定数据划分结果。通过本发明可以解决由于电力数据的多样性和复杂性,现有技术无法对其进行精准划分,导致数据分类分级精准性不足的技术问题,可以提高电力数据分类分级的精细度和准确性,达到提高数据管理效率和处理质量的技术效果。
-
公开(公告)号:CN114185822B
公开(公告)日:2024-05-24
申请号:CN202111308502.7
申请日:2021-11-05
Applicant: 北京智芯微电子科技有限公司 , 国网思极紫光(青岛)微电子科技有限公司 , 国网信息通信产业集团有限公司 , 国网山东省电力公司信息通信公司 , 国家电网有限公司
Abstract: 本发明涉及数据缓存技术领域,提供一种多指针弹性缓冲器、增删控制字符的方法及存储介质。所述多指针弹性缓冲器,包括写指针、读指针、存储器,还包括:字符集检测模块和缓冲阈值测量模块;所述字符集检测模块配置有多组根据不同的接口协议定义的控制字符集检测逻辑,用于选择当前的控制字符集检测逻辑,检测输入数据中的控制字符集,在检测到控制字符集的情况下生成字符集检测信号;所述缓冲阈值测量模块用于确定存储器中有效数据的状态,在获取到字符集检测信号的情况下,根据存储器中当前的有效数据的状态确定读指针的递增值。本发明提高了弹性缓冲器设计的复用性和应用范围,且逻辑结构简单。
-
公开(公告)号:CN117520033A
公开(公告)日:2024-02-06
申请号:CN202311455579.6
申请日:2023-11-03
Applicant: 国网山东省电力公司信息通信公司 , 中国海洋大学
IPC: G06F11/07 , G06F16/35 , G06F40/284 , G06F40/30 , G06N3/0455 , G06N3/09
Abstract: 本发明公开了一种基于日志语义向量化和层次聚类的日志解析方法,包括:首先对经过预处理后的原始日志进行分词,利用正则表达式将日志消息中冗余数据去掉。然后,使用BERT将经过分词后的日志数据向量化,计算相似度和距离,最后使用在线层次聚类算法生成日志模板。本发明利用BERT日志语义向量化和层次聚类的日志解析模板提取的算法,可以输入不等长数据,不受日志格式的限制,通过自然语言处理也提取出日志的语义信息,所以适用于不同来源不同组件不同结构日志消息的日志模板的提取,有较高的精确度,且日志解析效率高,满足在线实时解析日志的需要。
-
公开(公告)号:CN114580467B
公开(公告)日:2023-11-17
申请号:CN202210163936.0
申请日:2022-02-22
Applicant: 国网山东省电力公司信息通信公司
IPC: G06F18/2431 , G06F18/2131 , G06F18/214 , G06N3/0442
Abstract: 本发明属于电力数据治理的技术领域,提供了基于数据增强和Tri‑Training的电力数据异常检测方法及系统,包括如下步骤:获取用电序列数据;对用电序列数据进行预处理,得到预处理后的用电序列数据集合;对预处理后的用电序列数据进行数据映射增强,获得用电序列数据在不同特征空间中的数据表征;对用电序列数据在不同特征空间中的数据表征,基于Tri‑Training方法对电力数据进行异常判定。通过对电力数据表征映射到不同特征空间的方式,获得了同一电力数据的不同表征形式,能够进一步发掘异常电力数据的模式,提高异常数据判别的准确性。
-
公开(公告)号:CN117056829A
公开(公告)日:2023-11-14
申请号:CN202311117785.6
申请日:2023-08-31
Applicant: 国网山东省电力公司信息通信公司
IPC: G06F18/2415 , G06N3/0464 , G06F18/214
Abstract: 本公开提供了基于自注意力深度学习的电力物联网流量分类方法及系统,涉及电力网络流量分析技术领域,获取电力物联网通信环境中的流量包,按照协议类别对不同的流量包进行初步分类;将初步分类后的每个流量包中的数据进行二进制解析,将每条流量转换为十六进制字符串;对每类流量包中的流量数据进行抽样,输入至CNN‑RNN模型中,通过自注意力机制提取流量数据的空间注意力特征和通道注意力特征,最后通过Softmax函数将类别输出转换为概率分布。本公开的方法加快了模型收敛速度,提高了流量数据分类准确率。
-
-
-
-
-
-
-
-
-