-
公开(公告)号:CN108958947B
公开(公告)日:2024-09-27
申请号:CN201811083903.5
申请日:2018-09-17
Applicant: 北京市计算中心有限公司
Abstract: 本发明实施例提供一种大数据一体机及其使用方法,其中大数据一体机包括数据处理单元和存储单元,数据处理单元与存储单元连接;存储单元内存储有数据集和大数据实验模板,数据处理单元通过虚拟机将数据集提供给学习终端,数据处理单元通过虚拟机内的Docker容器将大数据实验模板提供给学习终端。本发明实施例提供的大数据一体机及其使用方法,通过设计虚拟机+Docker容器的结构,基于大数据一体机实现了虚拟机管理与Docker容器管理的高度统一,为大数据教学和培训提供了友好、便捷、真实可操作的实践环境,减轻了大数据教学的工作量,降低了教学成本,提高了教学灵活性。
-
公开(公告)号:CN115170371A
公开(公告)日:2022-10-11
申请号:CN202210927355.X
申请日:2022-08-03
Applicant: 北京市计算中心有限公司
Abstract: 本发明提供了一种基于jupyter‑lab开发局域网的人工智能教育培训一体机系统,其特征在于,包括:课程端和管理端,还包括jupyter‑lab管理平台实现模块,基于后端功能实现jupyter‑lab管理平台;用户端通过电脑端的浏览器中访问教育培训一体机系统的IP、端口号、用户端账号密码即可与教育培训一体机系统信号连接、以实现上机操作。能够为用户省去安装软件、搭建环境的繁琐步骤,节约时间成本;能够为用户省去下载数据集和模型的过程,能够保证在教学时,学员的使用的环境、代码、数据都是相同的,提高教学质量,具有重要的研究意义和使用价值。
-
公开(公告)号:CN119180272A
公开(公告)日:2024-12-24
申请号:CN202411245067.1
申请日:2024-09-06
Applicant: 北京市计算中心有限公司
IPC: G06F40/194 , G06F40/268 , G06F40/284 , G06F40/295 , G06F40/30 , G06F16/35 , G06F18/22
Abstract: 本发明提供了一种基于语义分析和大数据指数的政务文本质量评价方法,包括如下步骤:第一步:根据待评价政务文本需要体现的n个维度设定对标数据采集源并进行数据采集;第二步:文本数据预处理,对第一步采集到的n个对标文本数据集进行文本数据预处理;第三步:对标政务文本数据集与待评价政务文本数据集的自然语言处理;第四步:n个分指数计算。依次计算待评价政务文本数据集与n个对标政务文本数据集的余弦相似度,依次得到n个分指数ρ分;第五步:对n个分指数进行加权,得到总指数ρ总。本发明利用大数据与人工智能技术构建的评价政务文本质量的大数据指数,能够通过智能化算法从相关性角度对政务文本的质量给出客观、智能的质量评价结果。
-
公开(公告)号:CN119025672A
公开(公告)日:2024-11-26
申请号:CN202410891650.3
申请日:2024-07-04
Applicant: 北京市计算中心有限公司
IPC: G06F16/35 , G06F18/23 , G06F40/30 , G06F40/258 , G06N3/08
Abstract: 本发明提供了一种基于大语言模型的标签体系建设方法,包括如下步骤:第一步:待处理文本整理和入库,第二步:调用预训练大模型使用其生成能力打出标签;第三步:对经过第二步得到的所有标签进行标签后处理;第四步:对经过第三步中标签后处理得到的标签进行聚类;第五步:对经过第四步得到的聚类结果利用预训练大模型得到标签体系;第六步:标签体系入库;第七步:使用构建的标签体系对第一步中得到的文本库打标签;该方法结合了深度学习、自然语言处理和大规模预训练模型的最新进展,解决当前文本分类需要预先建立标签体系以及标签体系不能完全反映文本内容分类问题,适用于多种文本类型,解决了现有技术中的弊端。
-
公开(公告)号:CN112988695B
公开(公告)日:2023-09-12
申请号:CN201911283671.2
申请日:2019-12-13
Applicant: 北京市计算中心有限公司
IPC: G06F16/182 , G06F16/176 , G06F16/28 , G06F15/76 , G16C60/00
Abstract: 一种超融合混合架构计算材料平台,包括基础设施模块,其配置成采用弹性基础设施架构实现云主机服务、云存储服务、高性能计算服务、以及研发环境支持服务;数据服务模块,其配置成以数据包为粒度对数据进行管理,通过构建标注系统、规范数据标注行为提高数据生产力,屏蔽各异构存储及文件系统,以屏蔽层为依托实现各种数据任务的操作以实现对数据的管理;平台服务模块,其配置成通过集成计算材料相关的多个HPC应用并结合数据仓库的访问以实现应用服务,通过HPC应用编排子系统和蒙特卡洛算法、以及通用算法库实现开发服务;应用软件模块,其配置成通过配属计算材料相关的软件以实现计算作业的编译以及运算;和用户接口模块。
-
公开(公告)号:CN116030120A
公开(公告)日:2023-04-28
申请号:CN202211100987.5
申请日:2022-09-09
Applicant: 北京市计算中心有限公司
Abstract: 本发明提供了一种识别并校正六边形的方法,包括:第一步:初步识别六边形图像,第二步:对六边形的六个顶点进行校正,第三步:获取六边形图像的形心,对六边形图像的形心进行校正。该方法能够准确识别图形边缘有噪音点或者不规整六边形,还能够对六边形图像的六个顶点进行校正,基于校正后的六边形图像的六个顶点可以进一步获取六边形图像的形心,对六边形图像的形心进行校正,很大程度上提高了准确度和精准度,解决了现有技术中无法识别图形边缘有噪音点或者不规整六边形的弊端,具有重要的研究意义和使用价值。
-
公开(公告)号:CN110705285B
公开(公告)日:2022-11-22
申请号:CN201910889703.7
申请日:2019-09-20
Applicant: 北京市计算中心有限公司
IPC: G06F40/289 , G06F16/36
Abstract: 本发明提供了一种政务文本主题词库构建方法、装置、服务器及可读存储介质,涉及数据处理技术领域技术领域,包括:步骤一,获取现有政务文本主题词库;步骤二,获取历届次政务文本词库;步骤三,获取网络政务文本扩充词库;步骤四,对经过所述步骤一、所述步骤二和所述步骤三分别获得的所述现有政务文本主题词库、所述历届次政务文本词库和所述网络政务文本扩充词库进行去重处理,形成最终政务文本主题词库,总之,本发明提供的政务文本主题词库构建方法、装置,工作量小、模型简单,能够大大提高工作效率的同时且能够满足工作精度需求,具有重要的研究意义和使用价值。
-
公开(公告)号:CN118350368B
公开(公告)日:2024-09-27
申请号:CN202410398209.1
申请日:2024-04-03
Applicant: 北京市计算中心有限公司
IPC: G06F40/284 , G06F18/22 , G06F18/213 , G06F40/295 , G06N20/00
Abstract: 本发明提供了一种基于NLP技术的大语言模型的多文档摘编方法,包括如下步骤:将多篇文档存入数据库形成文档库;获取综述题目输入预训练大语言模型,预训练大语言模型生成第一综述小标题;使用NLP技术获取第二综述小标题,将整合后的第一综述小标题和第二综述小标题输入预训练大语言模型;将文档库中的文档进行归类和切片,形成单个小标题及其对应的文档段落的向量库,利用大语言模型与Langchain技术生成小标题段落输入预训练大语言模型生成综述文本,经过预训练大语言模型润色处理输出最终综述文本,最终综述文本为存入文档库中的多篇文档的综述,能够帮助用户快速处理和分析大量的文本数据,提高工作效率和质量,同时保证数据的安全性和可靠性。
-
公开(公告)号:CN118350368A
公开(公告)日:2024-07-16
申请号:CN202410398209.1
申请日:2024-04-03
Applicant: 北京市计算中心有限公司
IPC: G06F40/284 , G06F18/22 , G06F18/213 , G06F40/295 , G06N20/00
Abstract: 本发明提供了一种基于NLP技术的大语言模型的多文档摘编方法,包括如下步骤:将多篇文档存入数据库形成文档库;获取综述题目输入预训练大语言模型,预训练大语言模型生成第一综述小标题;使用NLP技术获取第二综述小标题,将整合后的第一综述小标题和第二综述小标题输入预训练大语言模型;将文档库中的文档进行归类和切片,形成单个小标题及其对应的文档段落的向量库,利用大语言模型与Langchain技术生成小标题段落输入预训练大语言模型生成综述文本,经过预训练大语言模型润色处理输出最终综述文本,最终综述文本为存入文档库中的多篇文档的综述,能够帮助用户快速处理和分析大量的文本数据,提高工作效率和质量,同时保证数据的安全性和可靠性。
-
公开(公告)号:CN116030120B
公开(公告)日:2023-11-24
申请号:CN202211100987.5
申请日:2022-09-09
Applicant: 北京市计算中心有限公司
Abstract: 本发明提供了一种识别并校正六边形的方法,包括:第一步:初步识别六边形图像,第二步:对六边形的六个顶点进行校正,第三步:获取六边形图像的形心,对六边形图像的形心进行校正。该方法能够准确识别图形边缘有噪音点或者不规整六边形,还能够对六边形图像的六个顶点进行校正,基于校正后的六边形图像的六个顶点可以进一步获取六边形图像的形心,对六边形图像的形心进行校正,很大程度上提高了准确度和精准度,解决了现有技术中无法识别图形边缘有噪音点或者不规整六边形的弊端,具有重要的研究意义和使用价值。
-
-
-
-
-
-
-
-
-