-
公开(公告)号:CN118193708A
公开(公告)日:2024-06-14
申请号:CN202410411837.9
申请日:2024-04-08
Applicant: 中国地质大学(北京)
IPC: G06F16/332 , G06F16/36 , G06F16/951 , G06F40/279 , G06F18/214
Abstract: 本发明公开了一种基于大语言模型的矿物知识问答方法与系统,包括:使用爬虫技术,从国家岩矿化石标本资源库等平台获取相关矿物数据,经清洗后分为矿物知识文档和问答对,并将矿物知识文档存入分布式搜索引擎Elastic Search(ES);使用基于XGBoost的多特征融合精排算法得到和用户问题最相关的前k(k通常小于5)个文档,作为最终辅助大语言模型生成答案的矿物知识文档;使用LoRA高效微调大语言模型,并对大语言模型进行提示词(Prompt)设计来引导其生成矿物领域内容;本发明提供的方法与系统解决了目前的矿物问答系统只能回答最多涉及三个三元组、矿物知识回答能力有限、不能给出多句组成的矿物答案的问题,实现了矿物知识的专业性、准确性、灵活性和多样性的回答。
-
公开(公告)号:CN117392407A
公开(公告)日:2024-01-12
申请号:CN202311532000.1
申请日:2023-11-16
Applicant: 中国地质大学(北京)
IPC: G06V10/44 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明实施例公开了一种基于多粒度图像特征的矿物识别方法与系统,所述方法与系统将同一矿物图像根据粒度不同裁剪出多个小块并分别采用随机拼图的方式拼接出3个新图,使用3个新图及原图共4个图像对骨干网络进行粒度由细到粗的4次训练,前3次经骨干网络的不同层提取相应粒度的矿物图像特征后分类,第4次融合所有粒度特征后分类,并且将不同粒度的4次分类结果加和后作为最终识别结果,训练时除第1次训练外的后3次训练均使用前一次粒度训练结束时的参数为初始值以进一步融合矿物多粒度图像特征。本发明解决了现有矿物识别方法与系统无法对矿物非常相似的细粒度特征进行识别而带来的识别准确率不高的问题,进一步提高了矿物识别准确率。
-
公开(公告)号:CN116580307A
公开(公告)日:2023-08-11
申请号:CN202310655461.1
申请日:2023-06-05
Applicant: 中国地质大学(北京)
IPC: G06V20/10 , G06V10/764 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于分布外检测的矿物识别方法与系统,所述方法与系统包括卷积神经网络(CNN)和单类支持向量机(OCSVM),首先固定OCSVM的参数令其输出判别为已知类,使用带有类别标签的矿物图像对CNN训练得到可以识别已知类矿物的CNN,然后固定CNN权重并用已知类矿物图像在此CNN的第2层特征向量训练OCSVM得到已知类矿物所在的高维空间超平面;2步训练完成后系统在识别实际矿物图像时将首先判断其是否在已知类矿物所在的高维空间超平面上,如果不在输出其为未知类,否则输出其为各已知类矿物的概率,本发明解决了现有方法与系统把不属于训练集类别的矿物识别为训练集中类别的误识别问题。
-
-