-
公开(公告)号:CN119847673A
公开(公告)日:2025-04-18
申请号:CN202411898076.0
申请日:2024-12-23
Applicant: 中国科学院计算技术研究所 , 中科南京信息高铁研究院
IPC: G06F9/455 , G06F16/903
Abstract: 本发明提出一种用于高效管理、拉取容器镜像的方案。在该方案中,在镜像仓库侧,对其镜像文件存储架构进行深度改进,采用数据块为单位细致梳理镜像文件的相关数据,精准识别并剔除重复数据块,极大降低了镜像仓库的存储压力,使存储资源得到更合理利用。在此基础上,巧妙融合哈希桶与布隆过滤器的技术优势,构建高效的指纹检索结构,显著提高数据块的检索效率;在客户端侧,以数据块为单位从镜像仓库拉取容器镜像以启动容器,这种精准拉取方式巧妙避开了不必要数据的传输,为数据传输开辟捷径,有效减少了网络资源占用,切实提高容器镜像拉取效率,全方位推动容器技术在数据处理与应用上的进步。
-
公开(公告)号:CN119759946A
公开(公告)日:2025-04-04
申请号:CN202411613241.3
申请日:2024-11-13
Applicant: 中国科学院计算技术研究所 , 中科南京信息高铁研究院
IPC: G06F16/2453 , G06F16/22 , G06F16/21 , G06F40/284 , G06N3/044 , G06N3/0442 , G06N3/042 , G06N3/08
Abstract: 本发明提供了一种代价估计模型构建方法,包括:步骤S1、获取已执行的历史查询计划以构建训练数据集;步骤S2、采用独热编码方式和词嵌入编码方式对历史查询计划进行编码处理,以获取历史查询计划的初始向量表示;步骤S3、构建初始模型;步骤S4、以历史查询计划的初始向量表示为输入,历史查询计划的执行代价为输出,执行多轮迭代训练更新初始模型参数直至收敛。本发明的技术方案在提取特征信息时额外提取算子位置信息的特征,使得代价估计模型能够更加全面的表示查询计划在算力网场景下的执行特性;还引入词嵌入编码方式进行编码处理,不仅提高了编码效率,还能在不牺牲准确性的前提下减少代价估计模型预测时占用的计算资源。
-
公开(公告)号:CN116048912B
公开(公告)日:2024-07-30
申请号:CN202211636518.5
申请日:2022-12-20
Applicant: 中科南京信息高铁研究院
IPC: G06F11/30 , G06F18/2431 , G06F18/214 , G06F18/2433
Abstract: 本发明涉及数据处理领域,具体涉及一种基于弱监督学习的云服务器配置异常识别方法主要包括以下步骤:S1:读取服务器基础配置信息,所述服务器基础配置信息包括离散变量与非离散变量,读取历史服务器使用时长;S2:将服务器基础配置信息作为CatBoost回归模型的特征变量,将历史服务器使用时长作为CatBoost回归模型的监督信息,得到服务器使用时长的预测模型;S3:将服务器基础配置信息中的非离散变量、使用服务器使用时长的预测模型得到的预期服务器使用时长作为孤立森林模型的特征变量,得到异常识别模型。本发明利用了服务器使用时长作为服务器搭配异常问题的弱监督信号,从而提升了模型的表现力。
-
公开(公告)号:CN116048912A
公开(公告)日:2023-05-02
申请号:CN202211636518.5
申请日:2022-12-20
Applicant: 中科南京信息高铁研究院
IPC: G06F11/30 , G06F18/2431 , G06F18/214 , G06F18/2433
Abstract: 本发明涉及数据处理领域,具体涉及一种基于弱监督学习的云服务器配置异常识别方法主要包括以下步骤:S1:读取服务器基础配置信息,所述服务器基础配置信息包括离散变量与非离散变量,读取历史服务器使用时长;S2:将服务器基础配置信息作为CatBoost回归模型的特征变量,将历史服务器使用时长作为CatBoost回归模型的监督信息,得到服务器使用时长的预测模型;S3:将服务器基础配置信息中的非离散变量、使用服务器使用时长的预测模型得到的预期服务器使用时长作为孤立森林模型的特征变量,得到异常识别模型。本发明利用了服务器使用时长作为服务器搭配异常问题的弱监督信号,从而提升了模型的表现力。
-
公开(公告)号:CN116450300A
公开(公告)日:2023-07-18
申请号:CN202310487399.X
申请日:2023-05-04
Applicant: 中科南京信息高铁研究院
Abstract: 本发明涉及软件开发领域,具体涉及一种基于容器技术的并行自动化GitOps系统,包括:统一Gitlab代码仓库运行环境,存放开发人员提交的代码的环境,同时为容器化的中间件服务提供基础运行环境;统一流水线任务容器运行环境,运行持续集成工具,同时按照所属分支类型为属于不同分支的流水线任务挂载属于该分支单独的仓库;统一业务容器开发运行环境,提供各个不同业务系统项目的各个小组之间相互资源隔离的自测环境,同时为其中的微服务容器提供映射到宿主机的端口;统一业务容器测试运行环境;统一业务容器生产运行环境。本发明能够充分利用服务器的计算和存储能力,在保证各个项目没有环境冲突的情况下,能够有效节约服务器资源,提高资源利用率。
-
-
-
-