一种可重叠的社群发现方法

    公开(公告)号:CN112948712B

    公开(公告)日:2022-03-25

    申请号:CN202110326914.7

    申请日:2021-03-26

    Abstract: 本发明公开了一种可重叠的社群发现方法,步骤如下:S1分布式计算图G中的所有极大团,统计极大团的数量信息并将极大团的数量信息发送到所有计算节点中;S2对所有的极大团进行排序和编码,给每个极大团分配唯一的编码确定极大团;S3计算极大团中的子团,将子团发送到不同计算节点中;S4在每个计算节点内,构建反向索引;S5对每个极大团,利用反向索引,计算与每个极大团与其同一个计算节点内有k‑1个共享顶点的极大团,使用并查集将极大团的I D保存在同一个集合中;S6合并不同集群中的并查集,求出相应的派系。采用上述结构的一种可重叠的社群发现方法,增加了系统对大图的处理能力,横向扩展更加容易且成本更低。

    一种基于三角形的超图稠密度度量方法

    公开(公告)号:CN114168803A

    公开(公告)日:2022-03-11

    申请号:CN202111530839.2

    申请日:2021-12-14

    Abstract: 本发明公开了一种基于三角形的超图稠密度度量方法,步骤如下:S1、输入超图HG=(V,EH),初始化集合S为空,集合S为Set,不可添加相同元素;S2、按序号从小到大遍历超图中所有的超边,对每条超边进行操作。本发明采用上述的一种基于三角形的超图稠密度度量方法,可以计算超图中存在的三角形个数并枚举所有三角形,可以应用于社区发现,高阶的超图分析,超图的稠密度计算,衡量社区是否紧密等领域。本发明提供了一种新型的超图三角形定义,并实现了一种高效的方案来度量超图稠密度的指标。

    全链路的自然语言转换为结构化查询语言的方法

    公开(公告)号:CN118227653A

    公开(公告)日:2024-06-21

    申请号:CN202410434738.2

    申请日:2024-04-11

    Abstract: 本发明公开了一种全链路的自然语言转换为结构化查询语言的方法,属于数据处理领域,包括以下步骤:S1、采用现有语料和提示工程预训练开源大语言模型;S2、基于知识图谱构建针对具体应用场景的NL2SQL语料库,获取训练集和测试集;S3、获得最佳开源大语言模型;S4、向最佳开源大语言模型中输入自然语言,查询并生成SQL语句。本发明采用上述全链路的自然语言转换为结构化查询语言的方法,结合知识图谱的结构化知识和开源大语言模型的强大自然语言处理能力,能够更好地理解查询中的实体和它们之间的关系,从而精准地捕捉用户的查询意图,即使在面对复杂或模糊的查询时也能保持较高的理解准确率。

    一种基于超图池化的文本情感分类方法

    公开(公告)号:CN115238075B

    公开(公告)日:2023-04-07

    申请号:CN202210912341.0

    申请日:2022-07-30

    Abstract: 本发明公开了基于超图池化的文本情感分类方法,将文本数据转化为文本超图,然后输入到超图模型中;超图模型设置有三个模块,每个模块均分为卷积层、池化层和读出层,且前一个模块输出的超图数据输入到后一个模块继续计算;超图卷积层通过超图卷积更新节点特征;超图池化层通过多层感知器线性变换得到节点重要度评分,并通过PageRank算法得到超边重要度评分,然后根据综合得分过滤节点;超图读出层读取每个维度节点特征的最大值和平均值,并进行求和;最后,将三个模块的读出层数值求和得到最终的文本超图特征表示,然后送入线性层进行文本情感分类。本发明采用上述文本情感分类方法,能够得到准确的文本情感信息,在情感分类任务中得到良好的表现效果。

    一种基于超图池化的文本情感分类方法

    公开(公告)号:CN115238075A

    公开(公告)日:2022-10-25

    申请号:CN202210912341.0

    申请日:2022-07-30

    Abstract: 本发明公开了基于超图池化的文本情感分类方法,将文本数据转化为文本超图,然后输入到超图模型中;超图模型设置有三个模块,每个模块均分为卷积层、池化层和读出层,且前一个模块输出的超图数据输入到后一个模块继续计算;超图卷积层通过超图卷积更新节点特征;超图池化层通过多层感知器线性变换得到节点重要度评分,并通过PageRank算法得到超边重要度评分,然后根据综合得分过滤节点;超图读出层读取每个维度节点特征的最大值和平均值,并进行求和;最后,将三个模块的读出层数值求和得到最终的文本超图特征表示,然后送入线性层进行文本情感分类。本发明采用上述文本情感分类方法,能够得到准确的文本情感信息,在情感分类任务中得到良好的表现效果。

    基于LSTM模型和超图的用户行为预测方法及系统

    公开(公告)号:CN113065321A

    公开(公告)日:2021-07-02

    申请号:CN202110420046.9

    申请日:2021-04-19

    Abstract: 本发明公开了一种基于LSTM模型和超图的用户行为预测方法及系统,涉及多人编辑协作技术领域,包括根据多个用户以及用户的交互关系构建用户协作超图;用户协作超图中的节点表示用户,超边表示在协作关系中与超边关联的多个用户的信息编辑交互行为;基于用户协作超图中每个节点的局部邻域信息,构建多个D邻域展开树;D邻域展开树表示为根节点经过不超过D条超边可达的节点子图;根据获取的当前阶段用户协作行为数据以及当前阶段用户协作行为数据关联的D邻域展开树,基于序列学习器,预测在协作关系中下一阶段用户编辑行为是否被接受。本发明能够达到预测多个用户行为的目的。

    一种基于超图超边匹配的分子网络分类方法及系统

    公开(公告)号:CN113033691A

    公开(公告)日:2021-06-25

    申请号:CN202110378057.5

    申请日:2021-04-08

    Abstract: 本发明公开了一种基于超图超边匹配的分子网络分类方法及系统。包括:获取多个分子网络的超图;超图包括有标签超图和无标签超图;对有标签超图和无标签超图进行超边扩展,得到有标签图和无标签图;通过图遍历的方法对有标签图和无标签图中每个结点生成深度子树;得到有标签子树集合和无标签子树集合;采用超边采样方法进行多次采样,得到多个有标签匹配边集和多个无标签匹配边集;根据有标签子树集合、无标签子树集合、多个有标签匹配边集和多个无标签匹配边集,计算有标签超图和无标签超图之间的相似度;根据有标签超图和无标签超图之间的相似度对无标签超图进行分类。本发明使用超图比较方法更容易对分子网络进行比较,从而对分子网络进行分类。

    一种可重叠的社群发现方法

    公开(公告)号:CN112948712A

    公开(公告)日:2021-06-11

    申请号:CN202110326914.7

    申请日:2021-03-26

    Abstract: 本发明公开了一种可重叠的社群发现方法,步骤如下:S1分布式计算图G中的所有极大团,统计极大团的数量信息并将极大团的数量信息发送到所有计算节点中;S2对所有的极大团进行排序和编码,给每个极大团分配唯一的编码确定极大团;S3计算极大团中的子团,将子团发送到不同计算节点中;S4在每个计算节点内,构建反向索引;S5对每个极大团,利用反向索引,计算与每个极大团与其同一个计算节点内有k‑1个共享顶点的极大团,使用并查集将极大团的I D保存在同一个集合中;S6合并不同集群中的并查集,求出相应的派系。采用上述结构的一种可重叠的社群发现方法,增加了系统对大图的处理能力,横向扩展更加容易且成本更低。

    一种用于网络流量分类的轻量化图结构数据构造方法

    公开(公告)号:CN118250231A

    公开(公告)日:2024-06-25

    申请号:CN202410393484.4

    申请日:2024-04-02

    Abstract: 本发明公开了一种用于网络流量分类的轻量化图结构数据构造方法,属于网络流量分类领域,包括以下步骤:步骤1、处理原始网络流量,对原始网络流量中的会话进行重构,将原始网络流量中杂乱的数据转换为规整的会话形式的网络流量;步骤2、将生成的会话形式的网络流量,进行图结构信息构建和样本属性生成;图结构信息构建是提取会话形式的网络流量中的通联关系信息,基于一定的策略将用户信息映射为图上的节点,将用户之间的通联关系映射为图上的边,利用节点和边构造出基础的图结构信息;样本属性生成是提取会话中的数据包,以特定的规则构造成高质低维的样本属性;步骤3、将构建好的图结构信息与样本属性结合,获得轻量化的图结构数据样本。

    一种基于图对比学习的复杂网络流量分类方法

    公开(公告)号:CN118214723A

    公开(公告)日:2024-06-18

    申请号:CN202410387167.1

    申请日:2024-04-01

    Abstract: 本发明公开了一种基于图对比学习的复杂网络流量分类方法,属于网络流量分类技术领域,包括以下步骤:步骤一、将原始网络流量转换为图结构数据;步骤二、通过数据增强算法,以特定的规则将输入的图结构数据转换为增强图一、增强图二;步骤三、将两张增强图分别送入共享参数的GNN编码器中,提取数据特征,得到特征一、特征二;步骤四、通过最大化特征一、特征二之间互信息的方法,更新GNN编码器的模型参数,重复此步骤完成模型训练;步骤五、模型训练完成后,利用GNN编码器提取网络流量的数据特征,将提取到的网络流量的数据特征送入分类器,实现流量分类;步骤六、通过设计稳定性指标计算分类结果的实际效果,衡量网络流量分类算法抗干扰性能。

Patent Agency Ranking