-
公开(公告)号:CN116541535B
公开(公告)日:2024-12-20
申请号:CN202310571923.1
申请日:2023-05-19
Applicant: 北京理工大学
IPC: G06F16/36 , G06F16/35 , G06F40/295 , G06N3/045 , G06N3/0442 , G06F40/30 , G06F40/237
Abstract: 本发明公开一种知识图谱自动构建方法、系统、设备及介质,涉及知识图谱信息抽取技术领域。该方法包括:对目标垂直领域进行知识建模,得到知识模型;将初始数据集划分为大样本数据和小样本数据;对小样本数据进行数据标注,并根据标注完成的小样本数据确定实体字典;根据实体字典,对大样本数据进行文本增强;根据标注完成的小样本数据和文本增强的大样本数据构建文本数据集;根据文本数据集训练命名实体识别模型;使用训练好的命名实体识别模型对目标文本数据进行实体抽取,并根据知识模型对抽取结果进行三元组映射,得到三元组实例;根据三元组实例构建知识图谱。本发明能够实现垂直领域知识图谱的自动构建。
-
公开(公告)号:CN116541535A
公开(公告)日:2023-08-04
申请号:CN202310571923.1
申请日:2023-05-19
Applicant: 北京理工大学
IPC: G06F16/36 , G06F16/35 , G06F40/295 , G06N3/045 , G06N3/0442 , G06F40/30 , G06F40/237
Abstract: 本发明公开一种知识图谱自动构建方法、系统、设备及介质,涉及知识图谱信息抽取技术领域。该方法包括:对目标垂直领域进行知识建模,得到知识模型;将初始数据集划分为大样本数据和小样本数据;对小样本数据进行数据标注,并根据标注完成的小样本数据确定实体字典;根据实体字典,对大样本数据进行文本增强;根据标注完成的小样本数据和文本增强的大样本数据构建文本数据集;根据文本数据集训练命名实体识别模型;使用训练好的命名实体识别模型对目标文本数据进行实体抽取,并根据知识模型对抽取结果进行三元组映射,得到三元组实例;根据三元组实例构建知识图谱。本发明能够实现垂直领域知识图谱的自动构建。
-