应用于矿物领域知识图谱的问答方法、电子装置及存储介质

    公开(公告)号:CN115269806A

    公开(公告)日:2022-11-01

    申请号:CN202210943240.X

    申请日:2022-08-08

    Abstract: 本发明公开了一种应用于矿物领域知识图谱的问答方法,该方法包括:根据已有矿物知识图谱定义问句意图类别并引入相关疑问词,构建问句集,训练问句意图识别和实体/属性抽取模型,用训练好的模型对用户输入的问句进行意图识别和实体/属性抽取,并生成知识图谱查询语句,向知识图谱输入查询语句,获得相应问句答案。本发明提供的矿物知识图谱问答方法、电子装置及存储介质,其通过构建问句意图模板和问句集对基于Bert的模型进行训练,在问句集构建过程中通过同义转换、句式重构以及汉英互译转换等方式增加问句数量,提高对形式多样的自然语言问题回答的能力,实现了对自然语言输入问句的准确回答。可以将该问答方法应用于矿物领域知识图谱的智能查询。

    一种基于大语言模型的矿物知识问答方法与系统

    公开(公告)号:CN118193708A

    公开(公告)日:2024-06-14

    申请号:CN202410411837.9

    申请日:2024-04-08

    Abstract: 本发明公开了一种基于大语言模型的矿物知识问答方法与系统,包括:使用爬虫技术,从国家岩矿化石标本资源库等平台获取相关矿物数据,经清洗后分为矿物知识文档和问答对,并将矿物知识文档存入分布式搜索引擎Elastic Search(ES);使用基于XGBoost的多特征融合精排算法得到和用户问题最相关的前k(k通常小于5)个文档,作为最终辅助大语言模型生成答案的矿物知识文档;使用LoRA高效微调大语言模型,并对大语言模型进行提示词(Prompt)设计来引导其生成矿物领域内容;本发明提供的方法与系统解决了目前的矿物问答系统只能回答最多涉及三个三元组、矿物知识回答能力有限、不能给出多句组成的矿物答案的问题,实现了矿物知识的专业性、准确性、灵活性和多样性的回答。

Patent Agency Ranking