一种基于众包模式在线标注遥感影像生成样本数据集的方法和装置

    公开(公告)号:CN113297902B

    公开(公告)日:2023-08-08

    申请号:CN202110401101.X

    申请日:2021-04-14

    Abstract: 本发明涉及一种基于众包模式在线标注遥感影像生成样本数据集的方法和装置。该方法的步骤包括:将遥感影像标注众包任务划分为若干子任务;读取各子任务对应的遥感影像区域数据作为遥感影像子图,采用机器学习模型对遥感影像子图提取待标注的矢量多边形;将子任务分配给参与众包任务的用户,执行子任务并得到用户对子任务中待标注的矢量多边形的语义标注结果;将采用机器学习模型获得的遥感影像未标注区域的预测结果与已标注的矢量多边形区域进行叠加合并,生成遥感影像标注样本数据集。本发明能够大大降低众包在线标注的工作量,能够保证所有子任务均能被执行,能够减轻在线可视化渲染的负担。

    一种通用的分布式异构数据一体化逻辑汇聚组织、发布与服务方法及系统

    公开(公告)号:CN111274294B

    公开(公告)日:2023-03-10

    申请号:CN202010021145.5

    申请日:2020-01-09

    Abstract: 本发明涉及一种通用的分布式异构数据一体化逻辑汇聚组织、发布与服务方法及系统。该方法包括:1)在中心端对公共基础数据进行注册,包括分布端的数据节点注册、元数据扩展要素注册、分类体系注册、许可协议注册;2)在分布端进行分布式异构数据的建库、管理与描述;3)在分布端进行分布式异构数据的统一封装与发布组织;4)在中心端进行数据资源集中发布审核与监控;5)在中心端进行数据资源的集成共享服务。本发明具有一体化、通用可定制特点,保证了数据组织、管理、封装、发布、审核与服务全流程的整体连通、高可定制和高可复用,大大提升了数据服务封装的通用性和灵活性。

    一种基于作者著作树和图神经网络的论文合作者推荐方法

    公开(公告)号:CN112069306B

    公开(公告)日:2022-09-09

    申请号:CN202010710086.2

    申请日:2020-07-22

    Abstract: 本发明公开了一种基于作者著作树和图神经网络的论文合作者推荐方法,其步骤包括:1)对于数据库中的每一个作者,收集该作者的论文并提取关键词信息,构建该作者的著作树;2)对每个著作树,基于图神经网络模型构建对应作者著作树的信息传播模型,将著作树上的论文信息和关键词信息传播到作者节点中,编码出对应作者初始的表征向量;3)从该数据库中抽取出所有合作过的作者对集合,训练信息传播模型的参数,优化各初始表征向量,得到各作者最终的表征向量;4)对于一需推荐合作者的论文A,遍历与论文A的作者未曾合作过的作者集合N;然后比较作者A与集合N中每一作者最终的表征向量余弦相似度,根据计算结果为论文A的作者推荐合作者。

    一种Python-Web环境中多用户共享使用Spark集群的实现方法和系统

    公开(公告)号:CN110471777B

    公开(公告)日:2022-04-15

    申请号:CN201910568205.2

    申请日:2019-06-27

    Abstract: 本发明涉及一种Python‑Web环境中多用户共享使用Spark集群的实现方法和系统。本发明引入多进程来支撑多个Spark上下文,能够利用有限数量的Spark上下文来服务和支持多用户的任务计算请求;利用协程而不是线程来守护子进程,协程之间自主调度;能够将任务计算结果或状态异步返回以便实时响应用户的请求,满足了Web实时交互式使用的需求;利用了Spark任务间调度的特性,对于一些耗时较长的任务,给予用户是否终止该任务的权限,能够让Web用户终止正在运行的Spark任务。本发明能够解决Python开发环境中多Web用户共享使用Spark集群的问题。

    无监督的基于表示学习的同名作者消歧方法及装置

    公开(公告)号:CN113111178B

    公开(公告)日:2021-12-10

    申请号:CN202110240824.6

    申请日:2021-03-04

    Abstract: 本发明公开了一种无监督的基于表示学习的同名作者消歧方法及装置,包括:对科学文献数据进行预处理;利用Word2Vec预训练模型和SCIBERT预训练模型分别生成基于Word2Vec和基于SCIBERT的文本语义表示向量;通过对消歧数据的处理生成局部异质网络,指定元路径metapath并利用metapath2vec方法获取基于局部图结构的论文关系表示向量;针对上述三种表征向量分别生成相似度矩阵并进行加权求和;利用无监督聚类方法进行聚类;对聚类离散点进行簇指派,得到最终消歧结果。本发明利用论文的表征信息,结合多重混合的表征学习和聚类离散点指派方法,增强消歧算法的泛化能力与鲁棒性,提高了消歧准确度与消歧效率。

    一种融合图数据库和人工智能算法的数据管理方法及系统

    公开(公告)号:CN109597919B

    公开(公告)日:2021-11-09

    申请号:CN201811212493.X

    申请日:2018-10-18

    Abstract: 本发明公开了一种融合图数据库和人工智能算法的数据管理方法及系统。本方法为:1)查询请求处理模块接收用户发出的指令;所述指令包括Blob对象信息和处理该Blob对象的算法名称;2)查询请求处理模块根据该指令从图数据库中获取该Blob对象,并将该Blob对象和算法名称发送给人工智能模块;3)人工智能模块根据该算法名称调用相关算法对该Blob对象进行处理并将得到的处理结果返回给用户。本发明实现了数据管理工具自身的智能化、功能的丰富化,填补了在非结构化数据管理及相关领域的空白。

    一种基于深度学习的遥感影像半自动标注方法和装置

    公开(公告)号:CN113111716A

    公开(公告)日:2021-07-13

    申请号:CN202110275234.7

    申请日:2021-03-15

    Abstract: 本发明涉及一种基于深度学习的遥感影像半自动标注方法和装置。该方法的步骤包括:基于公开遥感数据集,利用交叉熵损失函数预训练全卷积神经网络;采用预训练的全卷积神经网络对待标注的遥感影像进行预测,输出类别属性概率;根据类别属性概率计算遥感影像像素的不确定性度量值,设定阈值提取不确定像素;根据遥感影像分割的超像素中不确定像素的最小百分比筛选超像素作为推荐标注区域,对其进行人工标注;将推荐标注区域的人工标注和剩余区域的全卷积神经网络预测结果进行合并,得到最终标注结果。本发明能够使人工注释者免于繁重的手工绘制精确边界的负担,提高人工标注效率,还减少了标注工作量和人工标注的主观臆断。

    无监督的基于表示学习的同名作者消歧方法及装置

    公开(公告)号:CN113111178A

    公开(公告)日:2021-07-13

    申请号:CN202110240824.6

    申请日:2021-03-04

    Abstract: 本发明公开了一种无监督的基于表示学习的同名作者消歧方法及装置,包括:对科学文献数据进行预处理;利用Word2Vec预训练模型和SCIBERT预训练模型分别生成基于Word2Vec和基于SCIBERT的文本语义表示向量;通过对消歧数据的处理生成局部异质网络,指定元路径metapath并利用metapath2vec方法获取基于局部图结构的论文关系表示向量;针对上述三种表征向量分别生成相似度矩阵并进行加权求和;利用无监督聚类方法进行聚类;对聚类离散点进行簇指派,得到最终消歧结果。本发明利用论文的表征信息,结合多重混合的表征学习和聚类离散点指派方法,增强消歧算法的泛化能力与鲁棒性,提高了消歧准确度与消歧效率。

    面向SCM的工业互联网标识注册、解析方法及标识连接平台与系统

    公开(公告)号:CN112491960A

    公开(公告)日:2021-03-12

    申请号:CN202011189498.2

    申请日:2020-10-30

    Abstract: 本发明公开了一种面向SCM的工业互联网标识注册、解析方法及标识连接平台与系统,包括:根据客户端标识注册请求,调用工业互联网标识解析体系的接口进行标识注册;将标识注册信息的标识映射关系存储至标识连接平台数据库中,并将所述标识注册信息返回客户端;根据客户端标识解析请求,在标识连接平台缓存、标识连接平台数据库或工业互联网标识解析体系中进行标识解析查询,并将获取的相应标识映射关系返回至客户端。本发明通过标识连接平台将SCM系统与工业互联网标识解析体系进行关联,简化企业SCM应用与多个二级节点对接方式,打破了目前大多SCM应用都与行业二级节点强关联建设的现状,提高标识服务对接效率。

Patent Agency Ranking