基于信息损失约束的数据划分方法及装置

    公开(公告)号:CN116955482A

    公开(公告)日:2023-10-27

    申请号:CN202310774181.2

    申请日:2023-06-27

    Abstract: 本发明提供一种基于信息损失约束的数据划分方法及装置,包括:获取各空间网格单元中分布的时空数据,并确定空间网格单元的时空属性和属性值;基于各属性值计算任意相邻两个空间网格单元的邻接属性差异值,确定最小邻接属性差异值,将多个空间网格单元分为多个空间网格单元组;确定各空间网格单元组的代表性属性值,基于代表性属性值和空间网格单元组内的各空间网格单元的属性值计算信息损失值;在信息损失值不小于预设的信息损失阈值时,构建图网络,获取图网络的节点特征矩阵、邻接矩阵及节点度向量;基于训练好的图嵌入模型得到各节点的分区概率,基于各节点的分区概率得到时空数据分区结果。该方法提高了时空数据的划分效率及划分结果准确度。

    一种面向图神经网络的可视化管理系统

    公开(公告)号:CN115563060A

    公开(公告)日:2023-01-03

    申请号:CN202211151054.9

    申请日:2022-09-21

    Inventor: 邵蓥侠 王海江

    Abstract: 本发明提供一种面向图神经网络的可视化管理系统,包括图数据集分析及可视化模块、模型结构搭建及训练模块、日志管理模块和参数调优模块。通过规范图数据集的存储标准,并利用可视化库对图数据集进行可视化展示,对比图数据集差异。通过组件化构建图神经网络模型实现灵活调用、自定义、训练和分享,简化开发步骤。通过记录对图神经网络模型的操作,记载训练后的模型参数并建立日志,通过日志进行规范化存储,并进行可视化地对比分析,在此基础上对模型进行参数调优并记录结果,随时调用优化后的模型参数。构建应用程序编程接口连接各模块,根据用户需求随时调用展示图数据集以及优化后图神经网络模型,实施训练任务或模型评估,提高了开发效率。

    一种多领域与多学科科技政策资源检索方法及装置

    公开(公告)号:CN115344668A

    公开(公告)日:2022-11-15

    申请号:CN202210846693.0

    申请日:2022-07-05

    Abstract: 本发明提供一种多领域与多学科科技政策资源检索方法及装置,通过传统的预设相关性计算模型计算用户查询和各科技政策资源文本段的相似度并初步召回和粗排候选文档,再进一步引用深度语言模型BERT对初步召回的候选文档进行修正和重排以最终输出查询结果。基于无标注的文本对BERT模型进行预训练,并采用特定领域有标注的文本进行微调,提高了文本匹配任务完成过程中的语义捕获能力。通过分割候选文本为多个文本段,分别计算各文本段与用户查询之间的相似度后进行聚合得到第二相关性分数,以解决BERT模型输入限制的问题。本发明通过两阶段的查询检索,综合词汇、词义和结构层面的特征,提升了文本匹配的精度。

    模型训练及专利知识图谱补全方法、装置及存储介质

    公开(公告)号:CN114817576A

    公开(公告)日:2022-07-29

    申请号:CN202210738354.0

    申请日:2022-06-28

    Abstract: 本发明提供一种模型训练及专利知识图谱补全方法、装置及存储介质,该方法包括:获取包含目标补全类型实体的训练专利文本集合;识别并抽取每个训练专利文本中的所有实体,筛选出词频超过阈值的识别并抽取到的实体构成候选实体集合;将所述训练专利文本集合作为实体训练数据集,将所述候选实体集合中的每个实体作为一个分类标签;若专利文本与实体为一一对应关系,则使用Sigmoid函数来归一化分类标签,使用二元交叉熵作为损失函数,进行多分类任务训练以获得专利知识图谱补全模型;若非一一对应关系,则使用Softmax函数来归一化分类标签,交叉熵作为损失函数,进行多标签分类任务训练以获得专利知识图谱补全模型。本发明能够准确、高效的专利知识图谱补全。

    面向科技政策领域的知识图谱构建方法及系统

    公开(公告)号:CN113254602B

    公开(公告)日:2022-03-08

    申请号:CN202110763594.1

    申请日:2021-07-06

    Abstract: 本发明提供一种面向科技政策领域的知识图谱构建方法及系统,所述方法包括:获取待处理科技政策内容文本,并根据BERT模型生成所述待处理科技政策内容文本的字向量;根据双向长短时记忆网络BLSTM模型对所述字向量进行特征提取,得到所述待处理科技政策内容文本的时序特征向量;根据条件随机场CRF模型对所述时序特征向量进行实体识别,得到实体识别结果;通过双向门控循环单元层生成所述实体识别结果对应的特征向量;基于双重注意力机制对所述实体识别结果对应的特征向量进行重要特征提取,并将提取到的重要特征输送至分类层对实体关系进行分类,获取实体关系分类结果;根据实体识别结果及实体关系分类结果构建所述待处理科技政策内容文本的知识图谱。

    专利文本分类方法、电子设备及计算机存储介质

    公开(公告)号:CN113254656B

    公开(公告)日:2021-10-22

    申请号:CN202110763595.6

    申请日:2021-07-06

    Abstract: 本发明提供了一种专利文本分类方法、电子设备及计算机存储介质,其中,该方法包括:获取专利文本的字向量表示;利用卷积神经网络提取字向量表示中的短语特征;利用长短时记忆网络提取字向量表示中的上下文特征;利用注意力层为长短时记忆网络输出的隐层特征向量添加不同权重,以突出区分度较大部分并降低文本结构和重复度较高结构权重,得到第一注意力层的输出;利用全连接层将第一注意力层的输出压缩为与短语特征的维度匹配的特征向量;将专利文本的短语特征和上下文特征连接得到输入向量,利用第二注意力层为输入向量添加注意力权重,以减少融合过程信息损失,得到融合特征向量,用于对专利文本分类。通过上述方案能够提高专利文本分类准确性。

    一种在公共安全场景中认知异质图结构的方法和系统

    公开(公告)号:CN119128415A

    公开(公告)日:2024-12-13

    申请号:CN202410968447.1

    申请日:2024-07-18

    Abstract: 本发明提供一种在公共安全场景中认知异质图结构的方法和系统,所述方法包括:获取针对公共安全场景预先搭建的认知融合模型,所述认知融合模型包含针对公共安全场景中包含的事物和事物间关系预先搭建的异质图;基于异质图包含的语义信息和拓扑信息构建元路径,将所述异质图分解为多个邻居子图;利用标准化的拉普拉斯矩阵对选定的预设数量的元路径进行翻转,从而实现对邻居子图的扰乱,得到多个带有噪声的邻居子图;利用认知融合模型包含的谱图模型对带有噪声的邻居子图在节点预测任务中进行元认知控制,利用多层感知器在节点预测任务中对认知融合模型进行训练,训练完成后的认知融合模型用于公共安全场景中的风险评估。

    基于多粒度采样的算力网络多维资源联合预测方法及系统

    公开(公告)号:CN118555216A

    公开(公告)日:2024-08-27

    申请号:CN202411008898.7

    申请日:2024-07-26

    Abstract: 本发明提供一种基于多粒度采样的算力网络多维资源联合预测方法及系统,涉及算力网络技术领域,该方法包括以下步骤:对于算力网络中的每个算力节点,基于各项资源在多个历史时间点历史状态数据,构建每项资源的历史状态信息序列;对每项资源的历史状态信息序列采用多个采样间隔进行采样,对于每项资源构建多个采样序列;对于同种资源的采样序列进行注意力聚合,得到每个采样序列的第一聚合向量;对于相同采样间隔进行采样的不同种资源的采样序列对应的第一聚合向量进行注意力聚合,得到对应每个第一聚合向量的第二聚合向量;将同种资源的采样序列对应的第二聚合向量输入到预设的预测模型中,得到该种资源预测的资源状态。

    多源社交媒体自然灾害知识图谱实时构建方法及装置

    公开(公告)号:CN116737944A

    公开(公告)日:2023-09-12

    申请号:CN202310520479.0

    申请日:2023-05-09

    Inventor: 邵蓥侠 王海江

    Abstract: 本发明提供一种多源社交媒体自然灾害知识图谱实时构建方法及装置,包括:获取多源社交媒体自然灾害本体;基于定时技术实时爬取多源社交媒体中的灾害数据,并进行数据清洗和预处理;利用序列标注模型识别灾害数据中的实体,根据灾害属性特点采用规则化方法提取用户发表的灾害信息;采用TF‑IDF的方法提取灾害发生时的热议词;通过余弦相似度进行聚类,提取灾害发生时的热议话题和灾害科普信息;将提取得到的灾害实体、关系和属性与灾害官网得到的灾害实体与属性进行知识融合,得到多源社交媒体自然灾害知识图谱并存入Neo4j图数据库进行展示。本发明方法构建的知识图谱可以展示灾害之间、灾害内部以及灾害相关的社会舆情,数据来源多元且实时性高。

    一种基于图卷积网络和信息融合的实体对齐方法及装置

    公开(公告)号:CN116561346A

    公开(公告)日:2023-08-08

    申请号:CN202310819919.2

    申请日:2023-07-06

    Abstract: 本发明提供一种基于图卷积网络和信息融合的实体对齐方法及装置,所述方法的步骤包括:获取文献基础数据,文献基础数据包括文献中的实体之间的关系、实体对应的属性和实体在文献中的描述语句;基于文献中的实体之间的关系构建第一输入矩阵,将第一输入矩阵输入到预设的第一模型中,第一模型输出第一嵌入矩阵;基于实体对应的属性构建第二输入矩阵,将第二输入矩阵输入到预设的第二模型中,第二模型输出第二嵌入矩阵;将实体在文献中的描述语句输入到第三模型中,第三模型输出第三嵌入矩阵;基于第一嵌入矩阵、第二嵌入矩阵和第三嵌入矩阵构建联合矩阵;将联合矩阵中的每一行构建为对应一个实体的实体向量,基于实体向量之间的距离进行实体对齐。

Patent Agency Ranking