-
公开(公告)号:CN114896359A
公开(公告)日:2022-08-12
申请号:CN202210522443.1
申请日:2022-05-13
Applicant: 国网江苏省电力有限公司信息通信分公司
Abstract: 本发明涉及数据处理技术领域,具体涉及一种知识本体信息的搜索方法,包括建立分析数据集,并基于分析数据集建立树状检索模型;提取查询请求中的索引号;将索引号输入树状检索模型进行检索,得到受控词;基于分析数据集建立相似度模型;将受控词输入相似度模型,得到多个拓展词;将受控词和多个拓展词整合,得到搜索结果,本发明通过对树状检索模型检索出的受控词进行概念拓展,得到了与受控词相关了拓展词,增加了搜索结果的范围,解决了现有的知识本体信息的搜索方法搜索结果的范围较窄,获取的信息量较少的问题。
-
公开(公告)号:CN111831792A
公开(公告)日:2020-10-27
申请号:CN202010630117.3
申请日:2020-07-03
Applicant: 国网江苏省电力有限公司信息通信分公司
IPC: G06F16/33 , G06F40/151 , G06F40/289 , G06F40/295 , G06K9/62
Abstract: 本发明公开了一种电力知识库构建方法,包括对语料进行预处理,获得语料文本;响应于语料文本为非结构化文本,将语料文本输入预先训练的命名实体识别模型,对语料文本中命名实体进行识别;将命名实体识别后的语料文本输入预先训练的命名实体关系抽取模型,获得命名实体关系数据;将命名实体关系数据进程存储,构建电力知识库。同时公开了相应的系统。本发明增加了非结构化数据,构建的知识库知识更加丰富,同时本发明通过命名实体识别模型和命名实体关系抽取模型抽取命名实体关系数据,知识库构建不需要自顶向下的建模,降低了构建的门槛,大大减少人工成本,无需大量的、长期的人工干预与校正。
-
公开(公告)号:CN111831788A
公开(公告)日:2020-10-27
申请号:CN202010547313.4
申请日:2020-06-16
Applicant: 国网江苏省电力有限公司信息通信分公司
IPC: G06F16/33 , G06F40/247 , G06F40/279 , G06K9/62
Abstract: 本发明公开了一种电力语料标记模型构建方法,包括对训练集中的已标记电力语料进行扩展,训练初始的标记模型;判断训练的标记模型是否满足预设要求,若不满足预设要求,用该标记模型对未标记的电力语料进行标记,并将标记后的电力语料放入训练集,对训练集中的已标记电力语料进行扩展,重新训练标记模型,重复该步骤,直到训练的标记模型满足预设要求。同时公开了相应的系统。本发明对训练集中的已标记电力语料进行扩展,用不满足预设要求的标记模型标记电力语料,并将标记后的电力语料加入训练集,采用滚雪球的方式扩大训练集,大大减少人工成本。
-
公开(公告)号:CN119577110A
公开(公告)日:2025-03-07
申请号:CN202411617129.7
申请日:2024-11-13
Applicant: 国网江苏省电力有限公司信息通信分公司
IPC: G06F16/334 , G06F16/353 , G06F18/2415 , G06N20/00
Abstract: 本发明公开了一种基于文本情感分析的搜索引擎系统,涉及搜索引擎技术领域,包括实时参数捕获与存储模块、异常分析与模型比对模块、风险评估模块以及应对措施模块:实时参数捕获与存储模块,在情感分析过程中,每一条文本都会生成一系列参数,对情感分析模型进行文本分析时生成的参数进行实时捕获和存储,确保数据流动的低延迟和完整性。本发明通过引入情感极化指数和预期违背指数,使系统精准捕捉复杂情绪,避免误判。实时参数捕获保障低延迟,机器学习多层次分析提升鲁棒性。通过低、中、高风险等级划分,系统实现按需干预和资源优化,避免业务损失与品牌形象受损,确保企业高效应对市场反馈与不确定性。
-
公开(公告)号:CN114970542A
公开(公告)日:2022-08-30
申请号:CN202210522355.1
申请日:2022-05-13
Applicant: 国网江苏省电力有限公司信息通信分公司
IPC: G06F40/30 , G06N20/10 , G06K9/62 , G06F16/215
Abstract: 本发明涉及数据处理技术领域,具体涉及一种基于文本情感曲线的分析方法,包括获取文本信息;对文本信息进行预处理,得到训练集和测试集;构建学习模型;使用训练集和测试集对学习模型进行训练和测试,得到监督学习模型;对待测文本进行预处理,得到待测特征;将待测特征输入监督学习模型进行训练,得到情感曲线图;对情感曲线图进行分析,得到分析结果,本发明通过建立监督学习模型可实现对待测文本进行自动分析,生成情感曲线图,解决了现有的文本情感分析方法的人工成本高的问题。
-
公开(公告)号:CN119311786A
公开(公告)日:2025-01-14
申请号:CN202411435706.0
申请日:2024-10-15
Applicant: 国网江苏省电力有限公司信息通信分公司 , 江苏电力信息技术有限公司
IPC: G06F16/31 , G06F16/3329 , G06N20/00
Abstract: 本发明公开了一种基于大模型的对话信息抽取方法、装置、设备及存储介质,该方法包括:确定信息抽取场景,基于信息抽取场景确定待抽取槽位;根据待抽取槽位,对待处理问题进行槽位信息抽取,得到已抽取信息以及抽取进度;在抽取进度为抽取未完成的情况下,生成反问问题,在抽取进度为抽取完成的情况下,基于已抽取信息生成待处理问题的回答结果。本发明实施例的技术方案,进行场景确认以便确定需要抽取的槽位信息,其次利用大模型的复杂语义理解能力进行信息抽取与自我反思,以确保抽取内容的完整性,再通过大模型的自问‑自答自动根据空缺槽位进行灵活的反问,以确保对话的灵活性以及友好性,最后完成整个抽取流程,并以结构化形式返回。
-
公开(公告)号:CN114896359B
公开(公告)日:2024-10-29
申请号:CN202210522443.1
申请日:2022-05-13
Applicant: 国网江苏省电力有限公司信息通信分公司
Abstract: 本发明涉及数据处理技术领域,具体涉及一种知识本体信息的搜索方法,包括建立分析数据集,并基于分析数据集建立树状检索模型;提取查询请求中的索引号;将索引号输入树状检索模型进行检索,得到受控词;基于分析数据集建立相似度模型;将受控词输入相似度模型,得到多个拓展词;将受控词和多个拓展词整合,得到搜索结果,本发明通过对树状检索模型检索出的受控词进行概念拓展,得到了与受控词相关了拓展词,增加了搜索结果的范围,解决了现有的知识本体信息的搜索方法搜索结果的范围较窄,获取的信息量较少的问题。
-
公开(公告)号:CN111831792B
公开(公告)日:2021-08-27
申请号:CN202010630117.3
申请日:2020-07-03
Applicant: 国网江苏省电力有限公司信息通信分公司
IPC: G06F16/33 , G06F40/151 , G06F40/289 , G06F40/295 , G06K9/62
Abstract: 本发明公开了一种电力知识库构建方法,包括对语料进行预处理,获得语料文本;响应于语料文本为非结构化文本,将语料文本输入预先训练的命名实体识别模型,对语料文本中命名实体进行识别;将命名实体识别后的语料文本输入预先训练的命名实体关系抽取模型,获得命名实体关系数据;将命名实体关系数据进行存储,构建电力知识库。同时公开了相应的系统。本发明增加了非结构化数据,构建的知识库知识更加丰富,同时本发明通过命名实体识别模型和命名实体关系抽取模型抽取命名实体关系数据,知识库构建不需要自顶向下的建模,降低了构建的门槛,大大减少人工成本,无需大量的、长期的人工干预与校正。
-
-
-
-
-
-
-