面向引文网络的频率自适应静态异质图节点分类方法

    公开(公告)号:CN117421671B

    公开(公告)日:2024-03-05

    申请号:CN202311732766.4

    申请日:2023-12-18

    Applicant: 南开大学

    Abstract: 本发明公开了一种面向引文网络的频率自适应静态异质图节点分类方法,首先从引文网络数据中提取出特征,构建静态异质图;再忽略静态异质图的顶点类型和边类型,通过受约束的马尔可夫过程得到转移状态矩阵收敛时图的稳定的转移状态,再将随机游走概率大于给定阈值的顶点对作为新的类型的边加入到静态异质图中;再通过空间线性映射将不同的顶点类型从原始空间映射到同一向量空间中,再对每个顶点来自一阶邻居的信号分离高频和低频信号,并通过个性化注意力机制为每个顶点聚合高低频信号;最后,通过空间线性映射将顶点的表示向量映射回原始空间,通过加权交叉熵和受约束的注意力机制训练模型,再通过分类器将引文网络数据的顶点进行分类。

    一种基于最小略图的流模式下有向标签图的略图构建方法

    公开(公告)号:CN107203635B

    公开(公告)日:2020-08-11

    申请号:CN201710421147.1

    申请日:2017-06-07

    Applicant: 南开大学

    Abstract: 一种基于最小略图的流模式下有向标签图的略图构建方法。在这个数据爆炸的时代,各类应用每天都会产生海量的数据,同时各类应用所产生的数据也在不断地飞速增长中。当前大量应用所产生的海量数据都可以用图模型、特别是有标签图模型来表示。为适应大数据的数据容量大以及输入输出速度快的特征,图压缩与略图上的查询成为了支持很多应用的一种有效手段。为了得到流模式下有标签图的略图,提出本发明的略图构建方法,该方法包括:对图数据上点的标签和标识符进行两级哈希映射;对图数据上边的标签进行哈希映射;利用一组质数的特性将多个边标签压缩在一个整数中;对流模式下滑动窗口的子窗口划分;对流模式下失效数据的自动处理。

    一种基于知识保护及选择的主题文本生成方法

    公开(公告)号:CN117610513A

    公开(公告)日:2024-02-27

    申请号:CN202410086840.8

    申请日:2024-01-22

    Applicant: 南开大学

    Abstract: 本发明涉及自然语言主题文本生成技术领域,提供一种基于知识保护及选择的主题文本生成方法。包括:采集待生成的主题文本数据;引入预训练的语言模型,冻结语言模型参数并构造可训练的动态前缀向量;通过语言模型编码器编码训练集,获得隐藏中间状态,作为解码器的初始状态进行解码,获得训练集对应的词表概率分布;通过包含知识选择的拷贝机制,计算获得解码器的解码状态与主题文本数据的相似度及未表达主题对应的拷贝概率分布;计算预测结果分布,计算获得负对数似然损失;更新动态前缀向量后,生成主题文本。本发明通过带有知识选择的拷贝机制同时考虑输入的主题信息与已生成文本中未表达的主题语义,保持了较高的主题一致性。

    基于节点签名的保留标签信息的异质网络嵌入方法

    公开(公告)号:CN110555139A

    公开(公告)日:2019-12-10

    申请号:CN201910811802.3

    申请日:2019-08-30

    Applicant: 南开大学

    Abstract: 一种基于节点签名的保留标签信息的异质网络嵌入方法。网络嵌入是将高维的图数据映射到低维向量,以解决高维图数据无法有效利用机器学习算法进行数据分析的一种方法。本发明方法具体包括:对网络中所有标签类型进行质数字典映射;提取网络节点的邻域标签集;构建节点签名向量;构建网络节点表示。本发明旨在综合利用异质图的网络结构、语义和标签信息,以数字签名的思想和质数的特性,构建异质图的网络表示学习框架,实现异质图上网络节点和边标签信息的保留,并根据学习到的异质网络节点表示进行后续节点聚类、分类、链路预测等机器学习任务,能够普适性地对现有同质及异质网络嵌入方法进行扩展和提升。

    一种基于最小略图的流模式下有向标签图的略图构建方法

    公开(公告)号:CN107203635A

    公开(公告)日:2017-09-26

    申请号:CN201710421147.1

    申请日:2017-06-07

    Applicant: 南开大学

    Abstract: 一种基于最小略图的流模式下有向标签图的略图构建方法。在这个数据爆炸的时代,各类应用每天都会产生海量的数据,同时各类应用所产生的数据也在不断地飞速增长中。当前大量应用所产生的海量数据都可以用图模型、特别是有标签图模型来表示。为适应大数据的数据容量大以及输入输出速度快的特征,图压缩与略图上的查询成为了支持很多应用的一种有效手段。为了得到流模式下有标签图的略图,提出本发明的略图构建方法,该方法包括:对图数据上点的标签和标识符进行两级哈希映射;对图数据上边的标签进行哈希映射;利用一组质数的特性将多个边标签压缩在一个整数中;对流模式下滑动窗口的子窗口划分;对流模式下失效数据的自动处理。

    基于滑动窗口的标签感知图形流草图构建方法及应用

    公开(公告)号:CN113987105B

    公开(公告)日:2024-06-14

    申请号:CN202111261676.2

    申请日:2021-10-28

    Applicant: 南开大学

    Abstract: 本发明属于图数据处理的技术领域,更具体地,涉及一种基于滑动窗口的标签感知图形流草图构建方法及应用。该方法首先,对于图数据流中的每个项目,使用现有的哈希方法和指纹技术获得项目的初始地址和指纹。其次,通过矩阵分块技术根据项目的顶点标签对其进行定位,并使用线性同余方法生成地址候选列表。稍后,设计双计数器机制高效存储项目的边缘标签及对应权重。最后,使用额外池存储矩阵中的冲突项目。本发明能够解决图数据流草图构建领域中的信息缺失问题,将顶点标签、边缘标签和时间戳高效嵌入草图,丰富了其表达能力。基于构建的草图,能够支持下游更多种类的查询和分析,例如交通网络中的路线规划以及社交网络中的虚假新闻检测。

    一种基于知识保护及选择的主题文本生成方法

    公开(公告)号:CN117610513B

    公开(公告)日:2024-04-02

    申请号:CN202410086840.8

    申请日:2024-01-22

    Applicant: 南开大学

    Abstract: 本发明涉及自然语言主题文本生成技术领域,提供一种基于知识保护及选择的主题文本生成方法。包括:采集待生成的主题文本数据;引入预训练的语言模型,冻结语言模型参数并构造可训练的动态前缀向量;通过语言模型编码器编码训练集,获得隐藏中间状态,作为解码器的初始状态进行解码,获得训练集对应的词表概率分布;通过包含知识选择的拷贝机制,计算获得解码器的解码状态与主题文本数据的相似度及未表达主题对应的拷贝概率分布;计算预测结果分布,计算获得负对数似然损失;更新动态前缀向量后,生成主题文本。本发明通过带有知识选择的拷贝机制同时考虑输入的主题信息与已生成文本中未表达的主题语义,保持了较高的主题一致性。

    异质信息网络上基于主题的社区搜索方法

    公开(公告)号:CN114722304A

    公开(公告)日:2022-07-08

    申请号:CN202210397374.6

    申请日:2022-04-15

    Applicant: 南开大学

    Abstract: 本发明公开了一种异质信息网络上基于主题的社区搜索方法,首先从目标异质信息网络的文本描述信息中提取出携带有文本信息的节点的主题,然后对与目标查询节点类型相同的节点进行主题聚合;然后根据给定的元结构对目标异质信息网络进行重构,返回按照这一元结构模式重构后的规模更小的新异质信息网络,并返回和这一元结构等价的元路径;最后在得到的新的异质信息网络上,按照新的元路径,按照输入的目标查询节点,采用现有的按照元路径进行社区搜索的方法进行社区搜索,搜索到和目标查询节点关联紧密并且主题相似的社区。

    基于自然语言的行程规划方法、系统、设备、产品及介质

    公开(公告)号:CN119539450B

    公开(公告)日:2025-05-02

    申请号:CN202510104793.X

    申请日:2025-01-23

    Applicant: 南开大学

    Abstract: 本发明涉及数据挖掘技术领域,提供基于自然语言的行程规划方法、系统、设备、产品及介质,包括:构建兴趣点数据集;获取用户输入文本和双层大语言模型,对用户输入文本进行解析和微调得到用户需求参数;通过兴趣点数据集对兴趣点进行聚类,得到初始候选列表,计算余弦相似度,以计算候选列表中兴趣点的兴趣点得分,对初始候选列表进行排序,得到中间候选列表;反转交换得到反转候选列表,计算每个反转候选列表的局部最优评分,并进行跨聚类替换,得到目标候选列表;生成目标候选列表,并计算综合行程评分,将综合行程评分最高的目标候选列表作为行程列表,并通过行程列表得到行程规划。本发明有效提高了行程规划的用户体验。

    异质信息网络上基于主题的社区搜索方法

    公开(公告)号:CN114722304B

    公开(公告)日:2025-03-28

    申请号:CN202210397374.6

    申请日:2022-04-15

    Applicant: 南开大学

    Abstract: 本发明公开了一种异质信息网络上基于主题的社区搜索方法,首先从目标异质信息网络的文本描述信息中提取出携带有文本信息的节点的主题,然后对与目标查询节点类型相同的节点进行主题聚合;然后根据给定的元结构对目标异质信息网络进行重构,返回按照这一元结构模式重构后的规模更小的新异质信息网络,并返回和这一元结构等价的元路径;最后在得到的新的异质信息网络上,按照新的元路径,按照输入的目标查询节点,采用现有的按照元路径进行社区搜索的方法进行社区搜索,搜索到和目标查询节点关联紧密并且主题相似的社区。

Patent Agency Ranking