一种面向知识图谱复杂逻辑推理的生成式方法

    公开(公告)号:CN118760745A

    公开(公告)日:2024-10-11

    申请号:CN202410736214.9

    申请日:2024-06-07

    Abstract: 本发明公开了一种面向知识图谱复杂逻辑推理的生成式方法。本发明包括查询转换模块和扩散推理模块,逻辑查询转换模块将一阶逻辑查询转换为输入序列,扩散推理模块展示了前向和后向的双向生成过程,并设计了一个结构增强自注意力机制的变换器。查询转换模块将符号化的一阶逻辑查询转换为自然语言输入序列,扩散推理模块通过前向过程和后向过程的多步生成过程来捕捉复杂逻辑查询的复合分布;同时,在扩散模型的转换器中设计了一个结构增强的自注意力机制,以有效地融合知识图谱中重要的结构特征。本发明通过对扩散中间过程的多粒度控制进一步保证了模型的可控性和可解释性;相较于其他基线方法实现了更好的知识图谱推理结果。

    基于属性图表示的用户网络节点或边的分类方法及系统

    公开(公告)号:CN118503775A

    公开(公告)日:2024-08-16

    申请号:CN202410499002.3

    申请日:2024-04-24

    Abstract: 本发明公开了基于属性图表示的用户网络节点或边的分类方法及系统,属于图数据处理领域,针对用户网络的属性信息构建属性图,计算所有邻居节点的属性信息和拓扑信息对目标节点的全局表示产生的影响;再将这两种影响与目标节点的全局表示进行融合,迭代得到目标节点最终的低维表示;输入到多层感知器中进行分类预测。本发明能够解决现有基于图神经网络的属性图表示学习方法中存在的属性扰动、过平滑问题以及属性、拓扑信息影响差异未被充分建模等问题,以及这些问题对最终分类预测造成的不良影响。

    一种基于支持向量机的面向智能专家推荐的用户画像方法

    公开(公告)号:CN111597330A

    公开(公告)日:2020-08-28

    申请号:CN201910129637.3

    申请日:2019-02-21

    Abstract: 本发明公开了一种基于支持向量机的面向智能专家推荐的用户画像方法,其步骤包括:1)利用设定专家的个人信息,获取一专家信息数据集;2)对该专家信息数据集中的每一条专家信息处理为一个由词语序列构建而成的句子;3)计算每篇文档中的每个词语的TF-IDF值,构成TF-IDF权重矩阵tdm;4)利用该TF-IDF权重矩阵tdm生成TF-IDF特征空间;然后在该TF-IDF特征空间中构建并训练支持向量机模型;5)根据待构建画像专家的文本信息生成对应TF-IDF值,然后在该TF-IDF特征空间中利用训练后的支持向量机模型对该TF-IDF值进行分类,生成该待构建画像专家的用户画像。本方法用户画像准确性高。

    一种基于图文融合的生成式摘要生成方法

    公开(公告)号:CN110704606A

    公开(公告)日:2020-01-17

    申请号:CN201910764261.3

    申请日:2019-08-19

    Abstract: 本发明公开了一种基于图文融合的生成式摘要生成方法,其步骤包括:1)将给定的文本数据集划分为训练集、验证集和测试集;其中,文本数据集中的每一样本是一三元组(X,I,Y),X是文本,I是文本X对应的图像,Y是文本X的摘要;2)对文本数据集的图像进行实体特征提取,并将提取的实体特征表示成与文本同维度的图像特征向量;3)使用训练集和训练集对应的图像特征向量对生成式摘要模型进行训练;4)输入一条文本和对应图像并生成该图像的图像特征向量,然后将该文本及其对应的图像特征向量输入到训练后的生成式摘要模型,得到该文本对应的摘要。本发明生成的摘要可以有效地调整文本中实体的权重,在一定程度缓解未登录词的问题。

    一种微博热点事件的地理位置发现方法

    公开(公告)号:CN105630884A

    公开(公告)日:2016-06-01

    申请号:CN201510957634.0

    申请日:2015-12-18

    CPC classification number: G06F17/3087 G06F17/30705

    Abstract: 本发明公开了一种微博热点事件的地理位置发现方法。本方法为:1)基于行政区规划地理词词典及中文简称词的命名规则构建一简称词词典,然后将该简称词词典与全称词词典进行关联;2)根据事件关键字,获取包含该事件关键字的微博信息;3)对获取的微博信息进行分词处理,得到该微博的分词集合,然后判断该分词集合中每一名词是否在该简称词词典或全称词词典中,如果存在则将该名词作为候选地理位置词保留;当该微博中出现多个候选地理位置词时,则选取一候选地理位置词作为该微博的地点;4)获取确定的每一地点的地理位置经纬度信息,然后对得到的地理位置经纬度信息进行聚类,根据聚类中心判断出事件爆发地点。本方法可更好的了解突发事件。

    一种基于分层迭代的长文本抽取式摘要生成方法和装置

    公开(公告)号:CN118332101B

    公开(公告)日:2025-05-16

    申请号:CN202410400400.5

    申请日:2024-04-03

    Abstract: 本发明属于文本信息抽取领域,涉及一种基于分层迭代的长文本抽取式摘要生成方法和装置。该方法包括:获取文本中字符的词向量、位置向量以及结构子标题向量,将其相加作为语义编码的输入,采用长文本预训练语言模型作为语义编码器,进行语义编码;将语义编码之后的向量送入各个层级编码器中,将语义信息沿着文本结构路线由句子层级至文档层级进行分层传递,然后从文档层级至句子层级再次进行分层传递,实现迭代更新,得到各个层级的隐层表示;通过融合各个层级的隐层表示全面地对每个句子进行评价,选出最优的摘要句。本发明能够克服现有抽取式摘要面向长文本时计算资源消耗大,存在语义损失以及长文本结构建模缺失的问题。

Patent Agency Ranking