-
公开(公告)号:CN118350368B
公开(公告)日:2024-09-27
申请号:CN202410398209.1
申请日:2024-04-03
Applicant: 北京市计算中心有限公司
IPC: G06F40/284 , G06F18/22 , G06F18/213 , G06F40/295 , G06N20/00
Abstract: 本发明提供了一种基于NLP技术的大语言模型的多文档摘编方法,包括如下步骤:将多篇文档存入数据库形成文档库;获取综述题目输入预训练大语言模型,预训练大语言模型生成第一综述小标题;使用NLP技术获取第二综述小标题,将整合后的第一综述小标题和第二综述小标题输入预训练大语言模型;将文档库中的文档进行归类和切片,形成单个小标题及其对应的文档段落的向量库,利用大语言模型与Langchain技术生成小标题段落输入预训练大语言模型生成综述文本,经过预训练大语言模型润色处理输出最终综述文本,最终综述文本为存入文档库中的多篇文档的综述,能够帮助用户快速处理和分析大量的文本数据,提高工作效率和质量,同时保证数据的安全性和可靠性。
-
公开(公告)号:CN106126976A
公开(公告)日:2016-11-16
申请号:CN201610425221.2
申请日:2016-06-15
Applicant: 北京市计算中心
IPC: G06F19/28
CPC classification number: G06F19/28
Abstract: 本发明提供了一种用于服务器中的生物信息分析系统。本发明提供的生物信息分析系统,集群了生物分析计算中常用的各类软件,当用户需要安装某一生物计算软件时,只需通过显示界面查找并点击该软件,系统即可自动对该软件进行安装,避免现有技术中需要用户自己查找并一一安装的麻烦,省时省力且方便快捷。此外,本发明提供的系统还能对经过生物计算软件计算之后的数据进行进一步的分析,得到分析结果,便于研究人员对于海量计算数据的分析与整合,使研究人员通过本发明提供的系统能够快速有效的获取需要的分析结果。
-
公开(公告)号:CN118350368A
公开(公告)日:2024-07-16
申请号:CN202410398209.1
申请日:2024-04-03
Applicant: 北京市计算中心有限公司
IPC: G06F40/284 , G06F18/22 , G06F18/213 , G06F40/295 , G06N20/00
Abstract: 本发明提供了一种基于NLP技术的大语言模型的多文档摘编方法,包括如下步骤:将多篇文档存入数据库形成文档库;获取综述题目输入预训练大语言模型,预训练大语言模型生成第一综述小标题;使用NLP技术获取第二综述小标题,将整合后的第一综述小标题和第二综述小标题输入预训练大语言模型;将文档库中的文档进行归类和切片,形成单个小标题及其对应的文档段落的向量库,利用大语言模型与Langchain技术生成小标题段落输入预训练大语言模型生成综述文本,经过预训练大语言模型润色处理输出最终综述文本,最终综述文本为存入文档库中的多篇文档的综述,能够帮助用户快速处理和分析大量的文本数据,提高工作效率和质量,同时保证数据的安全性和可靠性。
-
公开(公告)号:CN119180272A
公开(公告)日:2024-12-24
申请号:CN202411245067.1
申请日:2024-09-06
Applicant: 北京市计算中心有限公司
IPC: G06F40/194 , G06F40/268 , G06F40/284 , G06F40/295 , G06F40/30 , G06F16/35 , G06F18/22
Abstract: 本发明提供了一种基于语义分析和大数据指数的政务文本质量评价方法,包括如下步骤:第一步:根据待评价政务文本需要体现的n个维度设定对标数据采集源并进行数据采集;第二步:文本数据预处理,对第一步采集到的n个对标文本数据集进行文本数据预处理;第三步:对标政务文本数据集与待评价政务文本数据集的自然语言处理;第四步:n个分指数计算。依次计算待评价政务文本数据集与n个对标政务文本数据集的余弦相似度,依次得到n个分指数ρ分;第五步:对n个分指数进行加权,得到总指数ρ总。本发明利用大数据与人工智能技术构建的评价政务文本质量的大数据指数,能够通过智能化算法从相关性角度对政务文本的质量给出客观、智能的质量评价结果。
-
公开(公告)号:CN110705285B
公开(公告)日:2022-11-22
申请号:CN201910889703.7
申请日:2019-09-20
Applicant: 北京市计算中心有限公司
IPC: G06F40/289 , G06F16/36
Abstract: 本发明提供了一种政务文本主题词库构建方法、装置、服务器及可读存储介质,涉及数据处理技术领域技术领域,包括:步骤一,获取现有政务文本主题词库;步骤二,获取历届次政务文本词库;步骤三,获取网络政务文本扩充词库;步骤四,对经过所述步骤一、所述步骤二和所述步骤三分别获得的所述现有政务文本主题词库、所述历届次政务文本词库和所述网络政务文本扩充词库进行去重处理,形成最终政务文本主题词库,总之,本发明提供的政务文本主题词库构建方法、装置,工作量小、模型简单,能够大大提高工作效率的同时且能够满足工作精度需求,具有重要的研究意义和使用价值。
-
公开(公告)号:CN109190335B
公开(公告)日:2020-05-05
申请号:CN201811083036.5
申请日:2018-09-17
Applicant: 北京市计算中心
Abstract: 本发明实施例提供一种软件版权保护方法和系统,其中方法包括:若判断获知物理机的设备指纹信息与物理机中部署的虚拟机预存的软件许可文件中的虚拟机设备指纹信息一致,则启动虚拟机;虚拟机启动后,若判断获知物理机的设备指纹信息与虚拟机中部署的Docker容器预存的软件许可文件中的容器设备指纹信息一致,则启动Docker容器,运行Docker容器内的软件。本发明实施例提供的方法和系统,分别在虚拟机和Docker容器启动前对设备指纹信息进行认证,确保软件只能在一个授权的物理机上运行,解决了现有的软件版权保护方法无法限制软件的反复安装的问题,实现了有效的软件版权保护,且无需任何额外的硬件,成本低廉。
-
公开(公告)号:CN110705285A
公开(公告)日:2020-01-17
申请号:CN201910889703.7
申请日:2019-09-20
Applicant: 北京市计算中心
IPC: G06F40/289 , G06F16/36
Abstract: 本发明提供了一种政务文本主题词库构建方法、装置、服务器及可读存储介质,涉及数据处理技术领域技术领域,包括:步骤一,获取现有政务文本主题词库;步骤二,获取历届次政务文本词库;步骤三,获取网络政务文本扩充词库;步骤四,对经过所述步骤一、所述步骤二和所述步骤三分别获得的所述现有政务文本主题词库、所述历届次政务文本词库和所述网络政务文本扩充词库进行去重处理,形成最终政务文本主题词库,总之,本发明提供的政务文本主题词库构建方法、装置,工作量小、模型简单,能够大大提高工作效率的同时且能够满足工作精度需求,具有重要的研究意义和使用价值。
-
公开(公告)号:CN109190335A
公开(公告)日:2019-01-11
申请号:CN201811083036.5
申请日:2018-09-17
Applicant: 北京市计算中心
Abstract: 本发明实施例提供一种软件版权保护方法和系统,其中方法包括:若判断获知物理机的设备指纹信息与物理机中部署的虚拟机预存的软件许可文件中的虚拟机设备指纹信息一致,则启动虚拟机;虚拟机启动后,若判断获知物理机的设备指纹信息与虚拟机中部署的Docker容器预存的软件许可文件中的容器设备指纹信息一致,则启动Docker容器,运行Docker容器内的软件。本发明实施例提供的方法和系统,分别在虚拟机和Docker容器启动前对设备指纹信息进行认证,确保软件只能在一个授权的物理机上运行,解决了现有的软件版权保护方法无法限制软件的反复安装的问题,实现了有效的软件版权保护,且无需任何额外的硬件,成本低廉。
-
-
-
-
-
-
-