-
公开(公告)号:CN117195895A
公开(公告)日:2023-12-08
申请号:CN202311115750.9
申请日:2023-08-31
Applicant: 北京邮电大学
IPC: G06F40/295 , G06F40/237 , G06F40/30 , G06F16/35 , G06F16/36
Abstract: 本发明提供一种基于语义增强机制的关系抽取方法及系统,所述方法的步骤包括:基于预设的编码模型对检测语句进行编码,得到初始语句向量,所述初始语句向量中包括对应检测语句中的每个词语的初始词向量;基于预设的主体识别模块识别初始语句向量中的可能主体词向量,并输入到语义增强模块中;基于语义增强模块的分类层对可能主体词向量进行预分类,并构建对于每个可能主体词向量的相似词表;基于可能主体词向量的预分类结果和相似词表构建对于每个主体词向量的增强词向量;基于可能主体词向量构建主体语句向量,基于增强词向量构建增强语句向量,将初始语句向量、主体语句向量和增强语句向量输入到预设的客体与关系识别模块,得到关系分类结果。
-
公开(公告)号:CN114863194B
公开(公告)日:2022-11-18
申请号:CN202210807253.4
申请日:2022-07-11
Applicant: 北京邮电大学
IPC: G06V10/764 , G06V10/774 , G06V10/82 , G06V30/18 , G06V30/19 , G06V10/40 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明提供一种面向科技资讯跨媒体检索特征映射网络训练方法、检索方法及装置,基于对抗学习的方式构建特征映射器和媒体判别器,利用特征映射器将图像数据或文字数据的映射至一个统一的隐嵌入空间提取特征进行比对,在对抗学习过程中,通过构建联合损失使特征映射器关注语义特征在不同科技类别下的区别性、关注不同媒体间数据语义特征上的一致性,同时关注到对语义特征在媒体类别上的差异性,使得最终的特征映射器突破不同媒体之间提取语义特征的局限性,提高了科技资讯跨媒体检索的准确率。
-
公开(公告)号:CN114818737B
公开(公告)日:2022-11-18
申请号:CN202210745539.4
申请日:2022-06-29
Applicant: 北京邮电大学
Abstract: 本发明提供一种科技论文数据文本语义特征提取方法、系统及存储介质,所述方法包括:获取科技论文的文本信息,并基于获取到的科技论文的文本信息构建实体关系图,所述文本信息包括论文标题以及关键词,实体关系图中的节点为论文标题或关键词,实体关系图中的边为节点之间的关联关系;基于获取到的科技论文的文本信息提取语义特征,得到语义特征矩阵;基于实体关系图确定原始邻接矩阵,将语义特征矩阵及所述原始邻接矩阵输入至图网络模型,得到空间特征矩阵;将语义特征矩阵与空间特征矩阵进行特征融合,得到科技论文的最终语义特征。该特征提取方法在提取科技论文语料的语义特征的基础上,利用知识图谱的空间关联,可较好的提取到科技论文的语义特征。
-
公开(公告)号:CN114817576B
公开(公告)日:2022-11-18
申请号:CN202210738354.0
申请日:2022-06-28
Applicant: 北京邮电大学
Abstract: 本发明提供一种模型训练及专利知识图谱补全方法、装置及存储介质,该方法包括:获取包含目标补全类型实体的训练专利文本集合;识别并抽取每个训练专利文本中的所有实体,筛选出词频超过阈值的识别并抽取到的实体构成候选实体集合;将所述训练专利文本集合作为实体训练数据集,将所述候选实体集合中的每个实体作为一个分类标签;若专利文本与实体为一一对应关系,则使用Sigmoid函数来归一化分类标签,使用二元交叉熵作为损失函数,进行多分类任务训练以获得专利知识图谱补全模型;若非一一对应关系,则使用Softmax函数来归一化分类标签,交叉熵作为损失函数,进行多标签分类任务训练以获得专利知识图谱补全模型。本发明能够准确、高效的专利知识图谱补全。
-
公开(公告)号:CN114817578B
公开(公告)日:2022-09-09
申请号:CN202210745739.X
申请日:2022-06-29
Applicant: 北京邮电大学
Abstract: 本发明提供一种科技论文引用关系表示学习方法、系统及存储介质,所述方法包括:获取科技论文的关系图,所述关系图中的各节点表示各科技论文,所述关系图中的各边表示科技论文之间的引用关系;基于所述关系图确定第一科技论文特征矩阵及科技论文邻接矩阵;构建图自动编码器;将所述第一科技论文特征矩阵及科技论文邻接矩阵输入至图自动编码器,得到各科技论文的第一嵌入表示。该方法可使科技论文引用关系得到更准确的表示。
-
公开(公告)号:CN114817578A
公开(公告)日:2022-07-29
申请号:CN202210745739.X
申请日:2022-06-29
Applicant: 北京邮电大学
Abstract: 本发明提供一种科技论文引用关系表示学习方法、系统及存储介质,所述方法包括:获取科技论文的关系图,所述关系图中的各节点表示各科技论文,所述关系图中的各边表示科技论文之间的引用关系;基于所述关系图确定第一科技论文特征矩阵及科技论文邻接矩阵;构建图自动编码器;将所述第一科技论文特征矩阵及科技论文邻接矩阵输入至图自动编码器,得到各科技论文的第一嵌入表示。该方法可使科技论文引用关系得到更准确的表示。
-
公开(公告)号:CN113254602A
公开(公告)日:2021-08-13
申请号:CN202110763594.1
申请日:2021-07-06
Applicant: 北京邮电大学
IPC: G06F16/33 , G06F16/35 , G06F16/36 , G06F40/211 , G06F40/216 , G06F40/295 , G06F40/30 , G06K9/62 , G06N3/04 , G06N3/08 , G06Q50/18
Abstract: 本发明提供一种面向科技政策领域的知识图谱构建方法及系统,所述方法包括:获取待处理科技政策内容文本,并根据BERT模型生成所述待处理科技政策内容文本的字向量;根据双向长短时记忆网络BLSTM模型对所述字向量进行特征提取,得到所述待处理科技政策内容文本的时序特征向量;根据条件随机场CRF模型对所述时序特征向量进行实体识别,得到实体识别结果;通过双向门控循环单元层生成所述实体识别结果对应的特征向量;基于双重注意力机制对所述实体识别结果对应的特征向量进行重要特征提取,并将提取到的重要特征输送至分类层对实体关系进行分类,获取实体关系分类结果;根据实体识别结果及实体关系分类结果构建所述待处理科技政策内容文本的知识图谱。
-
公开(公告)号:CN116955482B
公开(公告)日:2024-06-04
申请号:CN202310774181.2
申请日:2023-06-27
Applicant: 北京邮电大学
Abstract: 本发明提供一种基于信息损失约束的数据划分方法及装置,包括:获取各空间网格单元中分布的时空数据,并确定空间网格单元的时空属性和属性值;基于各属性值计算任意相邻两个空间网格单元的邻接属性差异值,确定最小邻接属性差异值,将多个空间网格单元分为多个空间网格单元组;确定各空间网格单元组的代表性属性值,基于代表性属性值和空间网格单元组内的各空间网格单元的属性值计算信息损失值;在信息损失值不小于预设的信息损失阈值时,构建图网络,获取图网络的节点特征矩阵、邻接矩阵及节点度向量;基于训练好的图嵌入模型得到各节点的分区概率,基于各节点的分区概率得到时空数据分区结果。该方法提高了时空数据的划分效率及划分结果准确度。
-
公开(公告)号:CN116957067B
公开(公告)日:2024-04-26
申请号:CN202310777807.5
申请日:2023-06-28
Applicant: 北京邮电大学
IPC: G06N3/098 , G06N3/0464 , G06F18/2321 , G06N7/01 , G06Q50/26
Abstract: 本申请提供一种公共安全事件预测模型的强化联邦学习方法及装置,方法包括:针对各个节点各自本地的公共安全事件预测子模型的特征向量进行马尔科夫决策以得到当前的目标聚类参数,并基于OPTICS聚类算法对各个特征向量进行聚类以将节点划分至不同的聚簇并生成全局模型参数;若当前的迭代轮次为最后轮次,则将全局模型参数作为目标公共安全事件预测模型来对公共网络平台实时发布的文本数据进行公共安全事件预测。本申请能够在模型训练阶段实现高效的数据记录、学习和更新,同时可以在保护用户隐私的前提下实现数据的共享和聚合,能够实现针对文本数据进行公共安全事件发生及类型的自动化预测,能够有效提高公共安全事件预测的准确性及可靠性。
-
公开(公告)号:CN117272017A
公开(公告)日:2023-12-22
申请号:CN202311071070.1
申请日:2023-08-23
Applicant: 北京邮电大学
IPC: G06F18/213 , G06F18/241 , G06F18/25 , G06V10/40 , G06V10/764 , G06V10/774 , G06V10/80 , G06V10/82 , G06N3/045 , G06N3/0475 , G06N3/094 , G06N3/098 , G06N3/042
Abstract: 本发明提供一种异质图数据节点嵌入特征提取模型训练方法、嵌入特征提取方法、节点分类方法及装置,基于联邦学习的形式,在各客户端本地构建生成器和鉴别器利用对抗学习训练本地模型,并在中央服务器进行模型参数的聚合,有效保证数据隐私。同时,各客户端在本地训练的过程中,通过跨客户端通信,获取目标节点关联的跨客户端邻居节点的原始特征,并基于top‑k随机游走平的采样各类邻居参与到嵌入学习中,降低客户端数据差异对训练影响,提升联邦异质图神经网络的学习质量,提高了下游子任务的执行效率。
-
-
-
-
-
-
-
-
-