一种基于大语言模型的标签体系建设方法

    公开(公告)号:CN119025672A

    公开(公告)日:2024-11-26

    申请号:CN202410891650.3

    申请日:2024-07-04

    Abstract: 本发明提供了一种基于大语言模型的标签体系建设方法,包括如下步骤:第一步:待处理文本整理和入库,第二步:调用预训练大模型使用其生成能力打出标签;第三步:对经过第二步得到的所有标签进行标签后处理;第四步:对经过第三步中标签后处理得到的标签进行聚类;第五步:对经过第四步得到的聚类结果利用预训练大模型得到标签体系;第六步:标签体系入库;第七步:使用构建的标签体系对第一步中得到的文本库打标签;该方法结合了深度学习、自然语言处理和大规模预训练模型的最新进展,解决当前文本分类需要预先建立标签体系以及标签体系不能完全反映文本内容分类问题,适用于多种文本类型,解决了现有技术中的弊端。

    一种基于NLP技术的大语言模型的多文档摘编方法

    公开(公告)号:CN118350368B

    公开(公告)日:2024-09-27

    申请号:CN202410398209.1

    申请日:2024-04-03

    Abstract: 本发明提供了一种基于NLP技术的大语言模型的多文档摘编方法,包括如下步骤:将多篇文档存入数据库形成文档库;获取综述题目输入预训练大语言模型,预训练大语言模型生成第一综述小标题;使用NLP技术获取第二综述小标题,将整合后的第一综述小标题和第二综述小标题输入预训练大语言模型;将文档库中的文档进行归类和切片,形成单个小标题及其对应的文档段落的向量库,利用大语言模型与Langchain技术生成小标题段落输入预训练大语言模型生成综述文本,经过预训练大语言模型润色处理输出最终综述文本,最终综述文本为存入文档库中的多篇文档的综述,能够帮助用户快速处理和分析大量的文本数据,提高工作效率和质量,同时保证数据的安全性和可靠性。

    一种基于NLP技术的大语言模型的多文档摘编方法

    公开(公告)号:CN118350368A

    公开(公告)日:2024-07-16

    申请号:CN202410398209.1

    申请日:2024-04-03

    Abstract: 本发明提供了一种基于NLP技术的大语言模型的多文档摘编方法,包括如下步骤:将多篇文档存入数据库形成文档库;获取综述题目输入预训练大语言模型,预训练大语言模型生成第一综述小标题;使用NLP技术获取第二综述小标题,将整合后的第一综述小标题和第二综述小标题输入预训练大语言模型;将文档库中的文档进行归类和切片,形成单个小标题及其对应的文档段落的向量库,利用大语言模型与Langchain技术生成小标题段落输入预训练大语言模型生成综述文本,经过预训练大语言模型润色处理输出最终综述文本,最终综述文本为存入文档库中的多篇文档的综述,能够帮助用户快速处理和分析大量的文本数据,提高工作效率和质量,同时保证数据的安全性和可靠性。

    一种基于jupyter-lab开发网络服务的教育培训一体机系统

    公开(公告)号:CN217606369U

    公开(公告)日:2022-10-18

    申请号:CN202222034001.0

    申请日:2022-08-03

    Abstract: 本发明提供了一种基于jupyter‑lab开发局域网的人工智能教育培训一体机系统,其特征在于,包括:课程端和管理端,还包括jupyter‑lab管理平台实现模块,基于后端功能实现jupyter‑lab管理平台;用户端通过电脑端的浏览器中访问教育培训一体机系统的IP、端口号、用户端账号密码即可与教育培训一体机系统信号连接、以实现上机操作。能够为用户省去安装软件、搭建环境的繁琐步骤,节约时间成本;能够为用户省去下载数据集和模型的过程,能够保证在教学时,学员的使用的环境、代码、数据都是相同的,提高教学质量,具有重要的研究意义和使用价值。

Patent Agency Ranking