一种知识图谱自动构建方法、系统、设备及介质

    公开(公告)号:CN116541535B

    公开(公告)日:2024-12-20

    申请号:CN202310571923.1

    申请日:2023-05-19

    Abstract: 本发明公开一种知识图谱自动构建方法、系统、设备及介质,涉及知识图谱信息抽取技术领域。该方法包括:对目标垂直领域进行知识建模,得到知识模型;将初始数据集划分为大样本数据和小样本数据;对小样本数据进行数据标注,并根据标注完成的小样本数据确定实体字典;根据实体字典,对大样本数据进行文本增强;根据标注完成的小样本数据和文本增强的大样本数据构建文本数据集;根据文本数据集训练命名实体识别模型;使用训练好的命名实体识别模型对目标文本数据进行实体抽取,并根据知识模型对抽取结果进行三元组映射,得到三元组实例;根据三元组实例构建知识图谱。本发明能够实现垂直领域知识图谱的自动构建。

    一种面向非结构化数据的领域知识抽取方法

    公开(公告)号:CN115510245B

    公开(公告)日:2024-05-14

    申请号:CN202211259591.5

    申请日:2022-10-14

    Abstract: 本发明公开了一种面向非结构化数据的领域知识抽取方法,该方法为:基于双向长短时记忆神经网络及条件随机场建立实体抽取模型,基于注意力机制建立关系抽取模型,并分别训练两个模型;用训练好的实体抽取模型对待抽取的非结构化数据进行抽取,获得领域实体,并将领域实体以表格形式存储为领域实体表;用训练好的关系抽取模型对关系进行抽取,在领域实体表的基础上获得实体‑关系表;根据抽取得到的所有实体与关系,基于语义相似度进行知识融合,得到知识融合后的实体‑关系表,并在neo4j图数据库中建立知识图谱;本发明能够解决目前领域知识获取以手动为主,管理的效率低下,领域知识体系不够完善的问题,实现对非结构化数据的知识抽取。

    一种面向半结构化工艺数据的映射模板知识抽取方法

    公开(公告)号:CN115168606B

    公开(公告)日:2024-05-24

    申请号:CN202210775551.X

    申请日:2022-07-01

    Abstract: 本发明公开了一种面向半结构化工艺数据的映射模板知识抽取方法,该方法为:对半结构化工艺数据进行预处理,形成工艺数据表格;根据半结构化工艺数据的结构特征和内容特征,对工艺数据表格进行抽取区域划分,形成结构特征区域和内容特征区域,将各个抽取区域内的具体数据与预设的工艺知识图谱模式层进行映射,得到映射模板;根据映射模板,按照映射模板的类别对工艺数据表格中的内容进行知识提取,得到基于预设的工艺知识图谱模式层和映射模板的工艺知识库。本发明可以直接高效抽取半结构化工艺数据中的知识,在映射模板的知识约束和高精度映射下,工艺知识抽取可以保持较好的可靠性和较高的效率实现工艺知识的自动提取。

    一种面向半结构化工艺数据的映射模板知识抽取方法

    公开(公告)号:CN115168606A

    公开(公告)日:2022-10-11

    申请号:CN202210775551.X

    申请日:2022-07-01

    Abstract: 本发明公开了一种面向半结构化工艺数据的映射模板知识抽取方法,该方法为:对半结构化工艺数据进行预处理,形成工艺数据表格;根据半结构化工艺数据的结构特征和内容特征,对工艺数据表格进行抽取区域划分,形成结构特征区域和内容特征区域,将各个抽取区域内的具体数据与预设的工艺知识图谱模式层进行映射,得到映射模板;根据映射模板,按照映射模板的类别对工艺数据表格中的内容进行知识提取,得到基于预设的工艺知识图谱模式层和映射模板的工艺知识库。本发明可以直接高效抽取半结构化工艺数据中的知识,在映射模板的知识约束和高精度映射下,工艺知识抽取可以保持较好的可靠性和较高的效率实现工艺知识的自动提取。

    一种知识图谱自动构建方法、系统、设备及介质

    公开(公告)号:CN116541535A

    公开(公告)日:2023-08-04

    申请号:CN202310571923.1

    申请日:2023-05-19

    Abstract: 本发明公开一种知识图谱自动构建方法、系统、设备及介质,涉及知识图谱信息抽取技术领域。该方法包括:对目标垂直领域进行知识建模,得到知识模型;将初始数据集划分为大样本数据和小样本数据;对小样本数据进行数据标注,并根据标注完成的小样本数据确定实体字典;根据实体字典,对大样本数据进行文本增强;根据标注完成的小样本数据和文本增强的大样本数据构建文本数据集;根据文本数据集训练命名实体识别模型;使用训练好的命名实体识别模型对目标文本数据进行实体抽取,并根据知识模型对抽取结果进行三元组映射,得到三元组实例;根据三元组实例构建知识图谱。本发明能够实现垂直领域知识图谱的自动构建。

    一种面向非结构化数据的领域知识抽取方法

    公开(公告)号:CN115510245A

    公开(公告)日:2022-12-23

    申请号:CN202211259591.5

    申请日:2022-10-14

    Abstract: 本发明公开了一种面向非结构化数据的领域知识抽取方法,该方法为:基于双向长短时记忆神经网络及条件随机场建立实体抽取模型,基于注意力机制建立关系抽取模型,并分别训练两个模型;用训练好的实体抽取模型对待抽取的非结构化数据进行抽取,获得领域实体,并将领域实体以表格形式存储为领域实体表;用训练好的关系抽取模型对关系进行抽取,在领域实体表的基础上获得实体‑关系表;根据抽取得到的所有实体与关系,基于语义相似度进行知识融合,得到知识融合后的实体‑关系表,并在neo4j图数据库中建立知识图谱;本发明能够解决目前领域知识获取以手动为主,管理的效率低下,领域知识体系不够完善的问题,实现对非结构化数据的知识抽取。

Patent Agency Ranking