一种基于大语言模型的文本搜索匹配方法和系统

    公开(公告)号:CN118260382A

    公开(公告)日:2024-06-28

    申请号:CN202410368833.7

    申请日:2024-03-28

    Abstract: 本发明提供一种基于大语言模型的文本搜索匹配方法和系统,输入待搜索文本;基于大语言模型计算待搜索文本的词嵌入向量;将待搜索文本的词嵌入向量与预先构建的向量数据库中的词嵌入向量进行搜索匹配,得到匹配的词嵌入向量;将匹配的词嵌入向量对应的文本数据作为对待搜索文本的搜索结果进行输出;其中,向量数据库的词嵌入向量基于大语言模型构建。有效捕捉了长文本的语义信息,并提高了文本匹配的精确率和召回率,提升了待检索文本与检索结果之间的语义匹配度,无需重新训练模型,节约了构建模型的时间、金钱和人力成本。

    基于Llama模型的电子数据司法鉴定意见书质量评估方法及系统

    公开(公告)号:CN119938912A

    公开(公告)日:2025-05-06

    申请号:CN202411979797.4

    申请日:2024-12-31

    Abstract: 本发明提供一种基于Llama模型的电子数据司法鉴定意见书质量评估方法及系统,属于司法鉴定技术领域,包括:构建训练数据;采用低阶自适应算法对模型进行监督微调,得到应用于司法鉴定意见书质量评估垂直领域的质量评估模型;判断鉴定标准是否正确;若否则判定不合格;若是则基于检索增强生成模型和提示工程,使质量评估模型输出针对待评估司法鉴定意见书的质量评估结果。有益效果:使用低阶自适应算法进行监督微调,降低训练成本,提高模型在电子数据司法鉴定意见书质量评估这一垂直领域的针对性与专业性;基于提示工程提升鉴定意见书质量评估的效率与准确性;基于检索增强生成技术,提升时效性与灵活性,降低模型的知识更新成本。

Patent Agency Ranking