-
公开(公告)号:CN113157860B
公开(公告)日:2022-03-11
申请号:CN202110370413.9
申请日:2021-04-07
Applicant: 国网山东省电力公司信息通信公司 , 北京大学 , 南瑞集团有限公司
IPC: G06F16/33 , G06F16/36 , G06F40/289 , G06F40/242 , G06F40/216
Abstract: 本发明公布了一种基于小规模数据的电力设备检修知识图谱构建方法,包括以下步骤:爬取知识百科网站,构建电力基础语料数据集,所述电力基础语料数据集中至少包括检修手册和根据检修手册中的基础词汇爬取的百科知识;根据所述电力基础语料数据集和通用词典,统计词频构建电力领域主题词典;根据所述电力基础语料文档数据集,生成电力语义词向量转换模型,并根据所述转换模型计算所述检修手册中的基础词汇和所述百科知识的语义相似度;判断所述语义相似度是否大于阈值,如果是,则建立所述检修手册和所述百科知识之间的语义关联关系,构建知识图谱。本发明的方法可以满足故障原因查询、处理措施检索和相关知识参考的场景。
-
公开(公告)号:CN113157860A
公开(公告)日:2021-07-23
申请号:CN202110370413.9
申请日:2021-04-07
Applicant: 国网山东省电力公司信息通信公司 , 北京大学 , 南瑞集团有限公司
IPC: G06F16/33 , G06F16/36 , G06F40/289 , G06F40/242 , G06F40/216
Abstract: 本发明公布了一种基于小规模数据的电力设备检修知识图谱构建方法,包括以下步骤:爬取知识百科网站,构建电力基础语料数据集,所述电力基础语料数据集中至少包括检修手册和根据检修手册中的基础词汇爬取的百科知识;根据所述电力基础语料数据集和通用词典,统计词频构建电力领域主题词典;根据所述电力基础语料文档数据集,生成电力语义词向量转换模型,并根据所述转换模型计算所述检修手册中的基础词汇和所述百科知识的语义相似度;判断所述语义相似度是否大于阈值,如果是,则建立所述检修手册和所述百科知识之间的语义关联关系,构建知识图谱。本发明的方法可以满足故障原因查询、处理措施检索和相关知识参考的场景。
-
公开(公告)号:CN117610537A
公开(公告)日:2024-02-27
申请号:CN202311413683.9
申请日:2023-10-27
Applicant: 国网山东省电力公司信息通信公司 , 北京大学
Abstract: 本发明涉及自然语言处理技术领域,提供了基于核范数和图神经网络的情感因果关系抽取方法及系统,包括:获取文本;基于所述文本,通过情感因果关系抽取模型,得到文本中的情感和原因句子对;所述情感因果关系抽取模型在提取到所述文本中每个子句的初始隐状态表示后,使用图注意力网络进行子句之间的交互,得到每个子句的隐状态表示,并基于所述隐状态表示,预测出情感子句和原因子句,将所有的情感子句和原因子句两两组合为情感和原因句子对,并预测每个情感和原因句子对的概率,抽取出概率满足条件的情感和原因句子对;其中,情感因果关系抽取模型通过二元交叉熵和核范数组成的损失函数进行训练。提高了因果关系抽取的效果。
-
公开(公告)号:CN113723074A
公开(公告)日:2021-11-30
申请号:CN202110993094.7
申请日:2021-08-27
Applicant: 国网山东省电力公司信息通信公司
IPC: G06F40/211 , G06F40/295 , G06N3/04
Abstract: 本发明提供了一种基于证据检验增强的文档级关系抽取方法,该方法构建基于证据检验增强的文档级关系抽取模型,模型包括关系抽取模块和证据验证模块;通过联合训练的方式,使证据验证模块引导关系抽取模块关注对于关系判断更为重要的信息;由于采用了证据验证的方式利用证据信息,避免了直接使用证据进行关系抽取可能产生的错误传播问题,从而提高了文档级关系抽取的准确率。
-
公开(公告)号:CN117634466A
公开(公告)日:2024-03-01
申请号:CN202311220009.9
申请日:2023-09-20
Applicant: 国网山东省电力公司信息通信公司 , 国网山东省电力公司 , 北京大学
IPC: G06F40/211 , G06F40/289 , G06N3/048 , G06F18/241
Abstract: 本发明属于信息抽取领域,提供基于连接词增强的双流情感因果关系抽取方法及系统。其中,基于连接词增强的双流情感因果关系抽取方法包括对文本进行编码,得到文本中各个子句的隐状态表示;抽取出所有情感句和原因句;构建第一句对集合以及第二句对集合;得到各个集合对应的每个连接词及其隐状态表示;将第一句对集合中各个子句的隐状态表示与连接词的隐状态表示连接,得到句子对第一隐状态表示;将第二子句对集合中各个子句的隐状态表示与连接词的隐状态表示连接,得到句子对第二隐状态表示;根据句子对第一隐状态表示和句子对第二隐状态表示分别与句子对的映射关系,对应抽取出情感‑原因句子对以及原因‑情感句子对,确定出双流情感因果关系。
-
公开(公告)号:CN117332783A
公开(公告)日:2024-01-02
申请号:CN202311219833.2
申请日:2023-09-20
Applicant: 国网山东省电力公司信息通信公司 , 国网山东省电力公司 , 北京大学
IPC: G06F40/295 , G06F18/214 , G06F40/211
Abstract: 本发明公开一种基于重排序的命名实体识别方法、系统、设备及存储介质,涉及命名实体数据识别技术领域,包括:对文本训练集采用预构建的命名实体识别模型得到候选识别结果;对候选识别结果根据预设的标准答案计算F1分值,并按照F1分值对候选识别结果排序;对排序后的候选识别结果定义对比学习损失函数,以此对预构建的命名实体识别模型进行训练;对待处理文本采用训练后的命名实体识别模型,得到目标实体词的分类识别结果。提高命名实体识别效果。
-
公开(公告)号:CN113723074B
公开(公告)日:2023-04-18
申请号:CN202110993094.7
申请日:2021-08-27
Applicant: 国网山东省电力公司信息通信公司
IPC: G06F40/211 , G06F40/295 , G06N3/045
Abstract: 本发明提供了一种基于证据检验增强的文档级关系抽取方法,该方法构建基于证据检验增强的文档级关系抽取模型,模型包括关系抽取模块和证据验证模块;通过联合训练的方式,使证据验证模块引导关系抽取模块关注对于关系判断更为重要的信息;由于采用了证据验证的方式利用证据信息,避免了直接使用证据进行关系抽取可能产生的错误传播问题,从而提高了文档级关系抽取的准确率。
-
-
-
-
-
-