-
公开(公告)号:CN114792134B
公开(公告)日:2025-02-18
申请号:CN202111032526.4
申请日:2021-09-03
Applicant: 苏州空天信息研究院
Abstract: 本发明提出了一种基于解耦合学习策略的小样本知识推理方法,基于小样本知识推理模型实现综合推理特征提取、候选实体成立概率计算和最佳候选实体预测,其中综合推理特征提取基于头实体的嵌入向量和关系嵌入向量提取头实体的综合推理特征,包括嵌入特征和小样本特征;候选实体成立概率计算将头实体的嵌入特征和小样本特征输入推理得分器,计算候选实体在嵌入特征和小样本特征下成立的概率;最佳候选实体预测结合渐进学习因子和候选实体在嵌入特征和小样本特征下成立的概率,计算候选实体推理成立的综合概率,确定综合概率值最高的候选实体为最终推理结果。本发明为推理得分函数提供了综合性的推理信息,提高了小样本推理精度。
-
公开(公告)号:CN117009496A
公开(公告)日:2023-11-07
申请号:CN202310579818.2
申请日:2023-05-22
Applicant: 苏州空天信息研究院
IPC: G06F16/335 , G06F16/31 , G06F16/33 , G06F40/279 , G06N3/0464 , G06N3/08
Abstract: 本发明公开一种基于链接矩阵的多模态事件联合抽取方法,确定应用领域的事件结构体系,构建跨模态事件抽取数据集;构建图像块和文本序列之间的链接矩阵;基于ViLT构建多模态事件抽取模型,其中多模态Transformer编码器以图像块像素特征、词例特征和图像分块‑文本词例对特征为输入,得到多模态特征输入解码器,获取图文事件类型一致性特征、事件类型特征和图文事件要素特征;利用极大似然估计,取最大概率的图文事件类型匹配结果、事件类型、图文事件要素作为索引,利用索引映射得到文本事件信息。本发明解决了弱监督和无监督方法识别精度低,管道式多模态事件要素信息匹配不准确的问题,为多模态信息抽取领域提供了一种新的事件抽取策略。
-
公开(公告)号:CN114547292A
公开(公告)日:2022-05-27
申请号:CN202210022512.2
申请日:2022-01-10
Applicant: 苏州空天信息研究院
IPC: G06F16/35 , G06F40/194 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本发明提出了一种基于渐进迁移学习的细粒度实体分类方法,计算目标域的粗粒度标签与源域所有粗粒度标签的语义相似度,以及目标域的细粒度标签与源域所有细粒度标签的语义相似度;构建粗粒度标签映射集合和细粒度标签映射集合,计算语义相似度权重;通过BiLSTM网络提取语句的语义特征,得到源域粗粒度标签语句语义特征集合、细粒度标签语句语义特征集合以及目标域语义特征;计算整体粗粒度语义特征和整体细粒度语义特征,确定总的语义特征;将总的语义特征输入到softmax分类器,预测目标域选取的细粒度标签对应的实体标签;训练更新BiLSTM网络与softmax分类器参数,得到基于渐进迁移学习的细粒度实体分类模型。本发明提高了目标域细粒度实体分类准确性。
-
公开(公告)号:CN114398892A
公开(公告)日:2022-04-26
申请号:CN202111447552.3
申请日:2021-11-30
Applicant: 苏州空天信息研究院
IPC: G06F40/295 , G06F16/901 , G06F16/906 , G06V10/26 , G06K9/62
Abstract: 本发明公开了一种基于拓扑结构的图像图谱化实现方法,收集网络设备图标的相关图像,生成训练数据和验证数据;利用Unet语义分割网络进行语义分割模型训练,利用训练后的模型对输入图像的语义信息进行提取;利用膨胀和腐蚀算法对包含语义信息的图像进行处理,利用腐蚀算法去除图像中的噪声点,利用膨胀算法对图像中的连接线进行加粗;利用连通区域标定方法进行实例划分,得到不同的实例对象,获取每个实例对象的类别、大小、位置信息;利用自然语言处理方法对实例对象进行结果补充,并纠正语义分割模型识别可能出现的错误实例;进行图谱绘制,最后以JSON格式输出结果。本发明能够自动的从包含网络拓扑结构的图像中提取出结构化的图谱信息。
-
公开(公告)号:CN114398892B
公开(公告)日:2024-09-24
申请号:CN202111447552.3
申请日:2021-11-30
Applicant: 苏州空天信息研究院
IPC: G06F40/295 , G06F16/901 , G06F16/906 , G06V10/26
Abstract: 本发明公开了一种基于拓扑结构的图像图谱化实现方法,收集网络设备图标的相关图像,生成训练数据和验证数据;利用Unet语义分割网络进行语义分割模型训练,利用训练后的模型对输入图像的语义信息进行提取;利用膨胀和腐蚀算法对包含语义信息的图像进行处理,利用腐蚀算法去除图像中的噪声点,利用膨胀算法对图像中的连接线进行加粗;利用连通区域标定方法进行实例划分,得到不同的实例对象,获取每个实例对象的类别、大小、位置信息;利用自然语言处理方法对实例对象进行结果补充,并纠正语义分割模型识别可能出现的错误实例;进行图谱绘制,最后以JSON格式输出结果。本发明能够自动的从包含网络拓扑结构的图像中提取出结构化的图谱信息。
-
公开(公告)号:CN116910312A
公开(公告)日:2023-10-20
申请号:CN202310822727.7
申请日:2023-07-06
Applicant: 苏州空天信息研究院
IPC: G06F16/901
Abstract: 本公开提供了一种图数据存储方法、装置、设备及存储介质,可以应用于数据库技术领域。该方法应用于目标存储设备,包括:响应于接收到目标图存储请求,基于目标图,得到多个节点索引项和多个边索引项,其中,目标图包括多个节点和多个边,节点索引项包括直接存储组和间接存储列表;对于多个边中的每个边,基于目标图中的多个节点各自与边之间的连接关系,确定与边相连的目标节点;将与边对应的边索引项插入至与目标节点对应的目标节点索引项的直接存储组或间接存储列表中。
-
公开(公告)号:CN114281941A
公开(公告)日:2022-04-05
申请号:CN202111513041.7
申请日:2021-12-11
Applicant: 苏州空天信息研究院
IPC: G06F16/33 , G06F40/194 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本发明提出了一种基于共享语义空间的远程监督关系抽取方法,将远程监督标注的数据划分为不含噪数据集和含噪声数据集;将句子的句向量和实体对的位置向量拼接作为BiLSTM网络的输入向量,分别提取含噪声数据集和不含噪数据集中的实体对特征;将实体对特征和关系类型表征映射到同一语义空间中;统计两个关系类型共有的实体类别数量,计算关系类型间的相关度,对不含噪数据集和含噪声数据集分别建模,学习实体对映射矩阵和关系类型映射矩阵;将实体对和关系类型通过学习到的映射矩阵映射到共享语义空间,计算实体对和关系类型的相似度得分,得分最高的关系类型为该实体对的关系。本发明解决了处理复杂关系时存在的语义漂移严重、数据噪声大等问题。
-
公开(公告)号:CN113886521A
公开(公告)日:2022-01-04
申请号:CN202111070442.X
申请日:2021-09-13
Applicant: 苏州空天信息研究院
IPC: G06F16/33 , G06F40/194 , G06F40/295 , G06F40/30
Abstract: 本发明提出一种基于相似词汇表的文本关系自动标注方法,确定所有抽取的关系名称以及对应的实体类型,并获取含有关系名称的语料;在语料中每个出现关系名称的地方生成可替代该关系名称的相似词汇表,并以此整理出关系类型词汇表;对句子进行命名体识别以及实体关系三元组提取;依据命名体识别的结果判断实体关系三元组的实体对是否满足条件,生成候选关系集合;对实体关系三元组中关系短语的每个词汇生成相似词汇表,结合关系类型词汇表,判断该词汇表达的候选关系,所有词汇中表达次数最多的候选关系即为标注关系,完成自动标注。本发明解决了传统远程监督方法构建知识库难度大、标注语料质量低的问题,为构建关系抽取模型所需的数据集提供了新的策略。
-
公开(公告)号:CN113886529B
公开(公告)日:2022-12-02
申请号:CN202111235748.6
申请日:2021-10-22
Applicant: 苏州空天信息研究院
IPC: G06F16/33 , G06F40/126 , G06F40/242 , G06F40/295 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本发明提出了一种面向网络安全领域的信息抽取方法及其系统,制定面向网络安全领域的实体和关系标注规范,构建实体和关系标签体系;使用半自动化标注策略生成训练数据,所述半自动化标注策略包括使用人工进行少量标注和使用基于知识库的远程监督方法进行补充标注;训练联合神经网络模型预测实体和关系,所述联合神经网络模型结合命名实体识别和关系抽取,在检测尾实体的位置时,同时对头实体和尾实体之间的关系进行判断。本发明针对网络安全领域实现实体和关系的抽取功能。
-
公开(公告)号:CN115357794A
公开(公告)日:2022-11-18
申请号:CN202211019358.X
申请日:2022-08-24
Applicant: 苏州空天信息研究院
IPC: G06F16/9535 , G06F40/30 , G06Q30/02 , G06Q30/06 , G06N3/08
Abstract: 本发明提出了一种基于张量分解的动态个性化推荐方法,对反映用户兴趣特征的用户‑物品‑时间关联网络数据进行统计,得到用户、物品和时间戳构成的集合,并对集合中的元素进行ID编号;将用户集合、物品集合和时间戳集合中的元素随机映射至语义向量空间中,建立用户、物品和时间戳到兴趣语义空间的初步映射关系;构建语义空间下用户、物品和时间之间的语义关联关系,使用户、物品和时间能够正确映射到语义空间中;根据用户、物品和时间到语义空间的语义关联关系,训练最优动态个性化推荐模型,预测用户的兴趣点,完成个性化推荐任务。本发明能有效学习用户随时间动态变化的兴趣,提升了个性化推荐的效果。
-
-
-
-
-
-
-
-
-