一种基于NLP技术的大语言模型的多文档摘编方法

    公开(公告)号:CN118350368B

    公开(公告)日:2024-09-27

    申请号:CN202410398209.1

    申请日:2024-04-03

    Abstract: 本发明提供了一种基于NLP技术的大语言模型的多文档摘编方法,包括如下步骤:将多篇文档存入数据库形成文档库;获取综述题目输入预训练大语言模型,预训练大语言模型生成第一综述小标题;使用NLP技术获取第二综述小标题,将整合后的第一综述小标题和第二综述小标题输入预训练大语言模型;将文档库中的文档进行归类和切片,形成单个小标题及其对应的文档段落的向量库,利用大语言模型与Langchain技术生成小标题段落输入预训练大语言模型生成综述文本,经过预训练大语言模型润色处理输出最终综述文本,最终综述文本为存入文档库中的多篇文档的综述,能够帮助用户快速处理和分析大量的文本数据,提高工作效率和质量,同时保证数据的安全性和可靠性。

    一种基于NLP技术的大语言模型的多文档摘编方法

    公开(公告)号:CN118350368A

    公开(公告)日:2024-07-16

    申请号:CN202410398209.1

    申请日:2024-04-03

    Abstract: 本发明提供了一种基于NLP技术的大语言模型的多文档摘编方法,包括如下步骤:将多篇文档存入数据库形成文档库;获取综述题目输入预训练大语言模型,预训练大语言模型生成第一综述小标题;使用NLP技术获取第二综述小标题,将整合后的第一综述小标题和第二综述小标题输入预训练大语言模型;将文档库中的文档进行归类和切片,形成单个小标题及其对应的文档段落的向量库,利用大语言模型与Langchain技术生成小标题段落输入预训练大语言模型生成综述文本,经过预训练大语言模型润色处理输出最终综述文本,最终综述文本为存入文档库中的多篇文档的综述,能够帮助用户快速处理和分析大量的文本数据,提高工作效率和质量,同时保证数据的安全性和可靠性。

    一种基于语义分析和大数据指数的政务文本质量评价方法

    公开(公告)号:CN119180272A

    公开(公告)日:2024-12-24

    申请号:CN202411245067.1

    申请日:2024-09-06

    Abstract: 本发明提供了一种基于语义分析和大数据指数的政务文本质量评价方法,包括如下步骤:第一步:根据待评价政务文本需要体现的n个维度设定对标数据采集源并进行数据采集;第二步:文本数据预处理,对第一步采集到的n个对标文本数据集进行文本数据预处理;第三步:对标政务文本数据集与待评价政务文本数据集的自然语言处理;第四步:n个分指数计算。依次计算待评价政务文本数据集与n个对标政务文本数据集的余弦相似度,依次得到n个分指数ρ分;第五步:对n个分指数进行加权,得到总指数ρ总。本发明利用大数据与人工智能技术构建的评价政务文本质量的大数据指数,能够通过智能化算法从相关性角度对政务文本的质量给出客观、智能的质量评价结果。

    一种政务文本主题词库构建方法、装置、服务器及可读存储介质

    公开(公告)号:CN110705285B

    公开(公告)日:2022-11-22

    申请号:CN201910889703.7

    申请日:2019-09-20

    Abstract: 本发明提供了一种政务文本主题词库构建方法、装置、服务器及可读存储介质,涉及数据处理技术领域技术领域,包括:步骤一,获取现有政务文本主题词库;步骤二,获取历届次政务文本词库;步骤三,获取网络政务文本扩充词库;步骤四,对经过所述步骤一、所述步骤二和所述步骤三分别获得的所述现有政务文本主题词库、所述历届次政务文本词库和所述网络政务文本扩充词库进行去重处理,形成最终政务文本主题词库,总之,本发明提供的政务文本主题词库构建方法、装置,工作量小、模型简单,能够大大提高工作效率的同时且能够满足工作精度需求,具有重要的研究意义和使用价值。

Patent Agency Ranking