云主机镜像文件的多备份就近存储和读取方法及系统

    公开(公告)号:CN103455577A

    公开(公告)日:2013-12-18

    申请号:CN201310371435.2

    申请日:2013-08-23

    Abstract: 本发明属于云计算中的基于分布式文件系统的云管理平台的镜像存储领域,涉及一种云主机镜像文件的多备份就近存储和读取方法及系统。该方法将云主机镜像文件分割成数据块并进行备份,然后存储在若干计算节点服务器中,其中本地计算节点服务器存储一份完整的云主机镜像文件,其它备份的数据块平均分配到其它计算节点服务器中存储;并采用元数据服务器记录云主机镜像文件的各数据块所对应存储的计算节点服务器信息;然后客户端优先从本地计算节点服务器读取数据,如果该本地计算节点服务器出现故障,则从其它计算节点服务器中并发读取整份数据。本发明适用于云管理平台中的云主机镜像文件的存储,能够提高系统的性能,获得更快的存储和读取速度。

    一种云计算系统中的资源统一调度方法

    公开(公告)号:CN103533086B

    公开(公告)日:2017-02-01

    申请号:CN201310532750.9

    申请日:2013-10-31

    CPC classification number: Y02D50/10

    Abstract: 本发明公开了一种云计算系统中的资源统一调度方法。本方法为:1)建立一物理资源池和一虚拟资源池;2)系统控制器根据资源请求的需求类型,将其转发到相应组件;3)物理资源池管理组件收到该请求后,从物理资源池中选择服务器,并上电开机、初始化后,返回访问地址和口令给该用户;虚拟资源池管理组件收到该请求后,从虚拟资源池中选择物理资源并创建虚拟机,返回访问地址和口令;当虚拟资源池中的使用率大于设定阈值时,资源调度器从物理资源池中选取服务器并注销,将其迁移到虚拟资源池并注册;当物理资源池中的资源使用率大于设定阈值时,从虚拟资源池中选择服务器并注销,然后将其迁移到物理资源池并注册。本发明资源利用率高、能耗低。

    一种云计算系统中的资源统一调度方法

    公开(公告)号:CN103533086A

    公开(公告)日:2014-01-22

    申请号:CN201310532750.9

    申请日:2013-10-31

    CPC classification number: Y02D50/10

    Abstract: 本发明公开了一种云计算系统中的资源统一调度方法。本方法为:1)建立一物理资源池和一虚拟资源池;2)系统控制器根据资源请求的需求类型,将其转发到相应组件;3)物理资源池管理组件收到该请求后,从物理资源池中选择服务器,并上电开机、初始化后,返回访问地址和口令给该用户;虚拟资源池管理组件收到该请求后,从虚拟资源池中选择物理资源并创建虚拟机,返回访问地址和口令;当虚拟资源池中的使用率大于设定阈值时,资源调度器从物理资源池中选取服务器并注销,将其迁移到虚拟资源池并注册;当物理资源池中的资源使用率大于设定阈值时,从虚拟资源池中选择服务器并注销,然后将其迁移到物理资源池并注册。本发明资源利用率高、能耗低。

    一种基于众包模式在线标注遥感影像生成样本数据集的方法和装置

    公开(公告)号:CN113297902B

    公开(公告)日:2023-08-08

    申请号:CN202110401101.X

    申请日:2021-04-14

    Abstract: 本发明涉及一种基于众包模式在线标注遥感影像生成样本数据集的方法和装置。该方法的步骤包括:将遥感影像标注众包任务划分为若干子任务;读取各子任务对应的遥感影像区域数据作为遥感影像子图,采用机器学习模型对遥感影像子图提取待标注的矢量多边形;将子任务分配给参与众包任务的用户,执行子任务并得到用户对子任务中待标注的矢量多边形的语义标注结果;将采用机器学习模型获得的遥感影像未标注区域的预测结果与已标注的矢量多边形区域进行叠加合并,生成遥感影像标注样本数据集。本发明能够大大降低众包在线标注的工作量,能够保证所有子任务均能被执行,能够减轻在线可视化渲染的负担。

    一种通用的分布式异构数据一体化逻辑汇聚组织、发布与服务方法及系统

    公开(公告)号:CN111274294B

    公开(公告)日:2023-03-10

    申请号:CN202010021145.5

    申请日:2020-01-09

    Abstract: 本发明涉及一种通用的分布式异构数据一体化逻辑汇聚组织、发布与服务方法及系统。该方法包括:1)在中心端对公共基础数据进行注册,包括分布端的数据节点注册、元数据扩展要素注册、分类体系注册、许可协议注册;2)在分布端进行分布式异构数据的建库、管理与描述;3)在分布端进行分布式异构数据的统一封装与发布组织;4)在中心端进行数据资源集中发布审核与监控;5)在中心端进行数据资源的集成共享服务。本发明具有一体化、通用可定制特点,保证了数据组织、管理、封装、发布、审核与服务全流程的整体连通、高可定制和高可复用,大大提升了数据服务封装的通用性和灵活性。

    一种基于作者著作树和图神经网络的论文合作者推荐方法

    公开(公告)号:CN112069306B

    公开(公告)日:2022-09-09

    申请号:CN202010710086.2

    申请日:2020-07-22

    Abstract: 本发明公开了一种基于作者著作树和图神经网络的论文合作者推荐方法,其步骤包括:1)对于数据库中的每一个作者,收集该作者的论文并提取关键词信息,构建该作者的著作树;2)对每个著作树,基于图神经网络模型构建对应作者著作树的信息传播模型,将著作树上的论文信息和关键词信息传播到作者节点中,编码出对应作者初始的表征向量;3)从该数据库中抽取出所有合作过的作者对集合,训练信息传播模型的参数,优化各初始表征向量,得到各作者最终的表征向量;4)对于一需推荐合作者的论文A,遍历与论文A的作者未曾合作过的作者集合N;然后比较作者A与集合N中每一作者最终的表征向量余弦相似度,根据计算结果为论文A的作者推荐合作者。

    一种Python-Web环境中多用户共享使用Spark集群的实现方法和系统

    公开(公告)号:CN110471777B

    公开(公告)日:2022-04-15

    申请号:CN201910568205.2

    申请日:2019-06-27

    Abstract: 本发明涉及一种Python‑Web环境中多用户共享使用Spark集群的实现方法和系统。本发明引入多进程来支撑多个Spark上下文,能够利用有限数量的Spark上下文来服务和支持多用户的任务计算请求;利用协程而不是线程来守护子进程,协程之间自主调度;能够将任务计算结果或状态异步返回以便实时响应用户的请求,满足了Web实时交互式使用的需求;利用了Spark任务间调度的特性,对于一些耗时较长的任务,给予用户是否终止该任务的权限,能够让Web用户终止正在运行的Spark任务。本发明能够解决Python开发环境中多Web用户共享使用Spark集群的问题。

    无监督的基于表示学习的同名作者消歧方法及装置

    公开(公告)号:CN113111178B

    公开(公告)日:2021-12-10

    申请号:CN202110240824.6

    申请日:2021-03-04

    Abstract: 本发明公开了一种无监督的基于表示学习的同名作者消歧方法及装置,包括:对科学文献数据进行预处理;利用Word2Vec预训练模型和SCIBERT预训练模型分别生成基于Word2Vec和基于SCIBERT的文本语义表示向量;通过对消歧数据的处理生成局部异质网络,指定元路径metapath并利用metapath2vec方法获取基于局部图结构的论文关系表示向量;针对上述三种表征向量分别生成相似度矩阵并进行加权求和;利用无监督聚类方法进行聚类;对聚类离散点进行簇指派,得到最终消歧结果。本发明利用论文的表征信息,结合多重混合的表征学习和聚类离散点指派方法,增强消歧算法的泛化能力与鲁棒性,提高了消歧准确度与消歧效率。

    一种融合图数据库和人工智能算法的数据管理方法及系统

    公开(公告)号:CN109597919B

    公开(公告)日:2021-11-09

    申请号:CN201811212493.X

    申请日:2018-10-18

    Abstract: 本发明公开了一种融合图数据库和人工智能算法的数据管理方法及系统。本方法为:1)查询请求处理模块接收用户发出的指令;所述指令包括Blob对象信息和处理该Blob对象的算法名称;2)查询请求处理模块根据该指令从图数据库中获取该Blob对象,并将该Blob对象和算法名称发送给人工智能模块;3)人工智能模块根据该算法名称调用相关算法对该Blob对象进行处理并将得到的处理结果返回给用户。本发明实现了数据管理工具自身的智能化、功能的丰富化,填补了在非结构化数据管理及相关领域的空白。

Patent Agency Ranking