-
公开(公告)号:CN115795018A
公开(公告)日:2023-03-14
申请号:CN202310102066.0
申请日:2023-02-13
Applicant: 广州海昇计算机科技有限公司 , 广东电网有限责任公司培训与评价中心 , 南京柯基数据科技有限公司
IPC: G06F16/332 , G06N20/00 , G06F16/31 , G06F16/335
Abstract: 本发明公开了一种面向电网领域的多策略智能搜索问答方法及系统,如下:对获取的用户问题、FAQ问题‑答案对库进行语义特征提取,将用户问题转化成向量形式,将每个FAQ问题‑答案对提取语义特征向量;构建每个问题‑答案对的向量索引;根据索引与用户问题对应的向量形式,利用FAISS进行向量检索,对用户问题向量和FAQ问题‑答案对库向量索引矩阵进行L2归一化处理,通过cosine similarity计算,得到的分数作为相似度依据,获取N个与用户问题相似度最高的向量,得到与用户问题相似度最高的N个问答对;对基于召回阶段得到相似度最高的N个问答对进行排序,返回相似度最高K个答案。
-
公开(公告)号:CN111984790A
公开(公告)日:2020-11-24
申请号:CN202010869904.3
申请日:2020-08-26
Applicant: 南京柯基数据科技有限公司
IPC: G06F16/35 , G06F40/295 , G06F40/216 , G06N3/08
Abstract: 本发明提出了一种实体关系抽取方法,属于实体关系抽取领域,本发明的方法为:构建语料库;选取语料库的数据进行标注得到标注数据集;并根据语料库构建正则模板,再通过正则模板对语料库的数据进行标注得到扩充数据集;将标注数据集和扩充数据集分为训练集和测试集;利用训练集训练神经网络模型,再利用训练后的神经网络模型对测试集进行处理得到关系分类结果;利用正则模板对测试集进行匹配得到分类结果;根据关系分类结果和匹配分类结果得到最终关系抽取结果。本发明克服了现有技术中仅使用神经网络模型进行实体关系抽取,抽取时标注数据量较少且抽取效果不佳的不足,本发明通过利用正则模板可以扩充标注数据量,并且可提高实体关系抽取的效果。
-
公开(公告)号:CN107562772B
公开(公告)日:2020-03-24
申请号:CN201710530618.2
申请日:2017-07-03
Applicant: 南京柯基数据科技有限公司
Inventor: 吴刚
IPC: G06F16/31 , G06F16/34 , G06F16/35 , G06F40/205 , G06F40/211 , G06F40/289 , G06F40/295
Abstract: 本发明公开了一种事件抽取方法、装置、系统和存储介质。该方法包括:利用对语料库进行模式学习得到的触发词,定位语料库的文档中的事件句,并根据触发词的关系分类确定事件句的事件类别;使用模式学习得到的模式,模式匹配事件句,得到与模式相匹配的事件句集;根据预设的与事件类别对应的事件学习模板,抽取事件句集中的事件内容。根据本发明实施例提供的事件抽取方法,可以提高事件内容抽取的效率和完整性。
-
公开(公告)号:CN108804521B
公开(公告)日:2021-05-14
申请号:CN201810392883.3
申请日:2018-04-27
Applicant: 南京柯基数据科技有限公司
IPC: G06F16/332 , G06F16/28 , G06F16/35 , G06F40/295 , G06F40/284 , G06Q50/02
Abstract: 本发明提出一种基于知识图谱的问答方法及农业百科问答系统,可以自动分析用户提出的自然语言问题,形成基于句法树的拓扑结构,通过拓扑结构与语法库中的问题模板进行检索和比对,根据拓扑结构与谓词指称的映射关系、同义词集合与知识图谱中关系或属性的映射关系,得到问题映射的谓词,并结合问题中识别的实体,生成最终的结构化的知识图谱查询语句,根据该查询语句到知识图谱中进行检索,返回最终的结果。当在问题模板库中无法检索到相关拓扑结构时,会调用FAQ问题库的常问问答对,进行问题的回答。该问答系统能够针对用户提出的问句给出精确的答案检索,提高用户对农业百科问题检索的满意度。
-
公开(公告)号:CN106844413B
公开(公告)日:2020-12-08
申请号:CN201610997671.9
申请日:2016-11-11
Applicant: 南京柯基数据科技有限公司
Inventor: 吴刚
IPC: G06F16/36 , G06F16/28 , G06F40/295
Abstract: 本发明实施例公开了一种实体关系抽取的方法,包括:确定给定文本的目标实体关系词,给定文本包括与预定实体相关的信息;识别给定文本中的除预定实体之外的实体,并存储形成实体库;基于预定特征根据给定文本所包含的实体库中的实体所在的句子来构建句子中的实体的特征向量;从特征向量中筛选出目标特征向量,目标特征向量指示了目标特征向量对应的实体所在的句子记录了目标特征向量对应的实体与预设实体之间存在目标实体关系;抽取与目标特征向量对应的实体。本发明实施例公开了一种实体关系抽取的方法及装置,能够避免泛化出错误的模式及引入错误的实体关系,能提高抽取实体关系的准确率和工作效率。
-
公开(公告)号:CN111966821A
公开(公告)日:2020-11-20
申请号:CN202010868187.2
申请日:2020-08-26
Applicant: 南京柯基数据科技有限公司
Abstract: 本发明公开了一种基于力学原理的知识图谱可视化方法,属于知识图谱可视化领域。本发明将知识图谱的三元组数据转换为关系集合和实体集合;其中,关系集合包括边数据,实体集合包括节点数据;再对边数据和的节点数据进行标记;并对标记后的边数据和节点数据分别进行去重;根据节点数据和边数据计算边的长度、节点与边的交点坐标以及计算边名称坐标;最后利用d3.js对节点和边进行渲染,得到可视化的知识图谱。本发明克服了现有技术中,无法将知识图谱三元组转为可视化的关系图的不足,本发明可以将知识图谱三元组转为关系图,可以实现直观地通过关系图分析问题的能力,更加直观且完整的表达了知识图谱中包含的信息。
-
公开(公告)号:CN107562772A
公开(公告)日:2018-01-09
申请号:CN201710530618.2
申请日:2017-07-03
Applicant: 南京柯基数据科技有限公司
Inventor: 吴刚
Abstract: 本发明公开了一种事件抽取方法、装置、系统和存储介质。该方法包括:利用对语料库进行模式学习得到的触发词,定位语料库的文档中的事件句,并根据触发词的关系分类确定事件句的事件类别;使用模式学习得到的模式,模式匹配事件句,得到与模式相匹配的事件句集;根据预设的与事件类别对应的事件学习模板,抽取事件句集中的事件内容。根据本发明实施例提供的事件抽取方法,可以提高事件内容抽取的效率和完整性。
-
公开(公告)号:CN115795018B
公开(公告)日:2023-05-09
申请号:CN202310102066.0
申请日:2023-02-13
Applicant: 广州海昇计算机科技有限公司 , 广东电网有限责任公司培训与评价中心 , 南京柯基数据科技有限公司
IPC: G06F16/332 , G06N20/00 , G06F16/31 , G06F16/335
Abstract: 本发明公开了一种面向电网领域的多策略智能搜索问答方法及系统,如下:对获取的用户问题、FAQ问题‑答案对库进行语义特征提取,将用户问题转化成向量形式,将每个FAQ问题‑答案对提取语义特征向量;构建每个问题‑答案对的向量索引;根据索引与用户问题对应的向量形式,利用FAISS进行向量检索,对用户问题向量和FAQ问题‑答案对库向量索引矩阵进行L2归一化处理,通过cosine similarity计算,得到的分数作为相似度依据,获取N个与用户问题相似度最高的向量,得到与用户问题相似度最高的N个问答对;对基于召回阶段得到相似度最高的N个问答对进行排序,返回相似度最高K个答案。
-
公开(公告)号:CN108804521A
公开(公告)日:2018-11-13
申请号:CN201810392883.3
申请日:2018-04-27
Applicant: 南京柯基数据科技有限公司
CPC classification number: G06F17/278 , G06F17/277 , G06Q50/02
Abstract: 本发明提出一种基于知识图谱的问答方法及农业百科问答系统,可以自动分析用户提出的自然语言问题,形成基于句法树的拓扑结构,通过拓扑结构与语法库中的问题模板进行检索和比对,根据拓扑结构与谓词指称的映射关系、同义词集合与知识图谱中关系或属性的映射关系,得到问题映射的谓词,并结合问题中识别的实体,生成最终的结构化的知识图谱查询语句,根据该查询语句到知识图谱中进行检索,返回最终的结果。当在问题模板库中无法检索到相关拓扑结构时,会调用FAQ问题库的常问问答对,进行问题的回答。该问答系统能够针对用户提出的问句给出精确的答案检索,提高用户对农业百科问题检索的满意度。
-
公开(公告)号:CN111984790B
公开(公告)日:2023-07-25
申请号:CN202010869904.3
申请日:2020-08-26
Applicant: 南京柯基数据科技有限公司
IPC: G06F16/35 , G06F40/295 , G06F40/216 , G06N3/08
Abstract: 本发明提出了一种实体关系抽取方法,属于实体关系抽取领域,本发明的方法为:构建语料库;选取语料库的数据进行标注得到标注数据集;并根据语料库构建正则模板,再通过正则模板对语料库的数据进行标注得到扩充数据集;将标注数据集和扩充数据集分为训练集和测试集;利用训练集训练神经网络模型,再利用训练后的神经网络模型对测试集进行处理得到关系分类结果;利用正则模板对测试集进行匹配得到分类结果;根据关系分类结果和匹配分类结果得到最终关系抽取结果。本发明克服了现有技术中仅使用神经网络模型进行实体关系抽取,抽取时标注数据量较少且抽取效果不佳的不足,本发明通过利用正则模板可以扩充标注数据量,并且可提高实体关系抽取的效果。
-
-
-
-
-
-
-
-
-