-
公开(公告)号:CN118535729A
公开(公告)日:2024-08-23
申请号:CN202410530486.3
申请日:2024-04-29
Applicant: 上海工程技术大学
IPC: G06F16/35 , G06F16/33 , G06F16/36 , G06N5/022 , G06F16/901 , G06F16/34 , G06F40/295
Abstract: 本发明涉及工业领域知识图谱三元组自动抽取和对齐的方法及装置,属于自然语言处理技术领域,包括以下步骤:步骤1:获取文本样本数据,对文本样本进行预处理,做成数据集;步骤2:将步骤1中的数据集放入结合低秩适配器方法对大型语言模型进行工业领域三元组抽取任务微调;步骤3:将步骤1中的数据集放入结合基于跨度的联合实体关系抽取方法对小型语言模型进行工业领域三元组抽取任务微调;步骤4:对抽取的结果进行处理;步骤5:将处理结果导出为知识图谱并存储为常见格式;步骤6:通过Neo4j图数据库进行知识图谱可视化展示。本发明通过大型语言模型和小型语言模型融合策略提高知识抽取和图谱构建的准确性和效率。