一种基于自身维度的高维k近邻微簇搜索方法

    公开(公告)号:CN120045742A

    公开(公告)日:2025-05-27

    申请号:CN202510108948.7

    申请日:2025-01-23

    Applicant: 东北大学

    Abstract: 本发明提供一种基于自身维度的高维k近邻微簇搜索方法,涉及相似性检索技术领域。该方法首先对向量数据库中的对象进行投影,计算每个对象的自身维度,对向量数据库中所有对象进行分块,并为每个数据块构建索引;将查询向量投影到向量数据库同一空间中,计算查询向量的基准维度;设定k近邻微簇查询结果的簇心与查询向量之间距离上限,从查询向量的基准维度为查询起点设置左右指针在指针对应的数据块内进行范围查询;检验k近邻微簇查询结果是否满足k近邻微簇查询距离要求和密度要求,更新距离上限,继续进行查询,直到左右指针都已达到查询结果所在数据块的左右边界,返回k近邻微簇结果集。

    一种基于代理模型的无监督进化图神经网络搜索方法

    公开(公告)号:CN120012823A

    公开(公告)日:2025-05-16

    申请号:CN202510084492.5

    申请日:2025-01-20

    Applicant: 东北大学

    Abstract: 本发明提供一种基于代理模型的无监督进化图神经网络搜索方法,涉及神经架构搜索技术领域,本发明在应用场景上考虑无监督场景,在网络层面上同时考虑网络层的拓扑关系、特征融合策略、不固定网络层数量,使用图对比学习方法训练图神经网络获取分类精度,使用遗传算法作为搜索算法,使用代理模型、权值共享策略减少了在搜索过程中图神经架构的评估时间。本发明适应无标签信息场景,同时考虑网络层的拓扑关系、特征融合策略,并且无需提前训练超网络,不固定网络层数,搜索空间更广,使用遗传算法全局搜索,引入预测器模块、权值共享策略减少搜索过程中图神经架构的评估时间。

    基于多特征学习的以太坊钓鱼诈骗账户检测装置及方法

    公开(公告)号:CN114782051B

    公开(公告)日:2025-03-14

    申请号:CN202210484477.6

    申请日:2022-05-06

    Applicant: 东北大学

    Abstract: 本发明提供了基于多特征学习的以太坊钓鱼诈骗账户检测装置及方法,涉及以太坊交易网络的安全领域。该装置包括数据采集模块、以太坊钓鱼诈骗网络构建模块、以太坊钓鱼诈骗网络初始化模块、特征提取模块、账户类别平衡模块和分类模块。该方法包括采集以太坊钓鱼诈骗相关数据;构建以太坊钓鱼诈骗网络G并确定该网络的邻接矩阵A;初始化该网络的节点特征和边特征,获得初始节点特征矩阵F和初始边特征矩阵X;根据A、F和X提取每个节点的相关特征,并为各特征分配注意力系数;对该网络中的账户类别进行平衡处理后,使用图神经网络更新节点的节点特征,并基于交叉熵损失函数训练分类器,区分出钓鱼诈骗账户和正常账户。该装置及方法准确度和安全性均较高且节约资源。

    一种基于最优运输规划的图自监督分类方法

    公开(公告)号:CN117574227A

    公开(公告)日:2024-02-20

    申请号:CN202311533979.4

    申请日:2023-11-17

    Applicant: 东北大学

    Abstract: 本发明提供一种基于最优运输规划的图自监督分类方法,涉及人工智能技术领域。该方法首先收集原始图数据,并对每个图数据进行图增强,生成两个扰动图,得到扰动图的图表示;再使用图神经网络作为编码器,生成图中各个节点的嵌入,得到扰动图的节点表示;然后对两个扰动图的图表示和节点表示分别生成最优运输概率矩阵;并以两个相同维度的最优运输概率矩阵为基础构建编码器的损失函数,将节点的向量表示空间与图空间对齐进行比较;重复执行该过程,直至损失函数收敛至数值稳定,获得扰动图的节点表示的编码器作为下游任务的预训练模型。该方法不依赖正负样本对的区分,不使用优化意义模糊的损失函数,能够在数据不完整的情况下表现出良好的性能。

    基于图神经网络的以太坊诈骗账户检测装置及方法

    公开(公告)号:CN116402509A

    公开(公告)日:2023-07-07

    申请号:CN202310393194.5

    申请日:2023-04-13

    Applicant: 东北大学

    Abstract: 本发明提供了基于图神经网络的以太坊诈骗账户检测装置及方法,涉及区块链中以太坊交易网络的安全技术领域。对于多数类节点的邻居进行欠采样以过滤不同类别的邻居,对少数类节点的邻居进行过采样链接与其特征相似或类别相同的邻居,有效缓解以太坊交易网络图的异质性问题。提取并学习节点特征时:聚合节点不同距离的邻居集合的特征,利用卷积和注意力机制对聚合的节点特征进行优化,更好地捕获以太坊交易网络图的结构信息;充分学习节点的时序特征,最终将两种不同类型的特征进行连接,使节点特征捕捉的信息更加全面。对少数类的采样概率高于多数类的采样概率,以缓解以太坊交易网络图中存在类别极端不平衡问题,提高分类器识别诈骗账户的准确性。

    一种基于多图多标记学习的软件Bug检测方法

    公开(公告)号:CN114168478A

    公开(公告)日:2022-03-11

    申请号:CN202111514505.6

    申请日:2021-12-13

    Applicant: 东北大学

    Abstract: 本发明公开了一种基于多图多标记学习的软件Bug检测方法,属于软件缺陷检测技术领域。该方法充分利用源代码中的图结构信息,并充分利用源代码和Bug报告之间深层次的语义关联,找到多图和多标记的对应关系,提供了基于程序源代码和对应Bug报告的多图多标记Bug检测数据的产生方法,将源代码和Bug报告转化为多图多标记数据来解决Bug的检测问题;并从图级和包级两个方面考虑,提出针对多图多标记数据的区分子图度量准则,进一步将多图多标记数据转化成计算机可以处理的向量形式的多示例多标记数据;传统的分类器链不能恰当地考虑标记排序问题,随机进行标记排列可能会造成性能下降,而本发明考虑了多标记之间的依赖关系可以极大地提高检测精度。

    一种基于垂直分解的并行频繁闭序列挖掘方法

    公开(公告)号:CN106599122B

    公开(公告)日:2019-12-31

    申请号:CN201611091669.1

    申请日:2016-12-01

    Applicant: 东北大学

    Abstract: 本发明提出一种基于垂直分解的并行频繁闭序列挖掘方法,属于数据挖掘领域,该方法采用序列求交的方式,缩短序列的长度,这相当于在竖直方向将原始序列分割成较短的序列;再从求交结果中选出K条差异度最大的序列,这又使得序列之间列数差异较大,两步均可缩短挖掘时间;本发明提出压缩频繁模式的观点,压缩模式的好处在于减小了频繁闭模式枚举范围,缩短挖掘时间,减小算法的时间复杂度;本发明采用现阶段最流行的并行框架Hadoop实现频繁闭序列挖掘算法;充分利用Hadoop的并行特点,将海量数据分散存储到集群中的各个节点上,按照map函数、reduce函数的特点编写算法,因为枚举出的模式独立的分发到不同节点进行检测封闭性,因此本方法获得较高的加速比。

    一种基于知识图谱增强图对比学习的推荐方法

    公开(公告)号:CN118014685A

    公开(公告)日:2024-05-10

    申请号:CN202410161790.5

    申请日:2024-02-05

    Applicant: 东北大学

    Abstract: 本发明提供一种基于知识图谱增强图对比学习的推荐方法,涉及数据推荐技术领域。该方法首先获取所有需要推荐的用户以及需要推荐的物品,并获取物品的属性信息;然后构建四个图结构;再构建多图融合模型,对推荐物品和用户进行特征向量学习,得到混有知识图谱信息和协作图信息的用户特征向量和推荐物品特征向量;构建纯协作图模型,对用户特征向量以及推荐物品特征向量进行学习,得到只包含交互信息的用户向量表示和推荐物品向量表示;确定统一的优化目标,进行迭代学习,得到用户和物品的两组特征向量;基于得到的用户和物品的特征向量,以及需要被推荐的用户列表,遍历用户列表,依次为每一个用户进行推荐。

    一种从Web点击流数据中挖掘代表序列模式的方法

    公开(公告)号:CN112765469B

    公开(公告)日:2023-10-27

    申请号:CN202110096836.6

    申请日:2021-01-25

    Applicant: 东北大学

    Abstract: 本发明提供一种从Web点击流数据中挖掘代表序列模式的方法,涉及序列模式挖掘技术领域。该方法首先输入Web点击流序列数据集、最小支持度和最大覆盖度,并遍历一次数据集保留不小于最小支持度的所有频繁站点作为序列生成种子;对每一个序列生成种子采用缝隙扩展枚举树,结合缝隙扫描剪枝策略和闭合检查得到该种子的所有频繁闭合超序列;进一步采用局部代表序列筛选技术选出该种子的所有代表序列;遍历所有序列生成种子,输出每个种子的代表序列,得到Web点击流数据的所有代表序列模式。优点是:代表序列模式能有效解决频繁序列模式数量庞大而可用性低的矛盾,能增强结果的可用性;为Web点击流的在线用户行为分析、信息推荐、引擎优化等应用提供参考。

    一种针对大图的基于对比学习的半监督社区搜索方法

    公开(公告)号:CN116501986A

    公开(公告)日:2023-07-28

    申请号:CN202310546779.6

    申请日:2023-05-16

    Applicant: 东北大学

    Abstract: 本发明提供一种针对大图的基于对比学习的半监督社区搜索方法,首先调用图划分算法对原始图进行预处理,将原始图处理成一些彼此间相关性较小的图分区,然后从原始图中选择出训练节点,确定每个训练节点所对应的图分区并进行初始化,其次联合图神经网络、超图神经网络和多层感知机模型对初始的低阶编码和高阶编码进行变换,得到图分区中每个节点最终的低阶编码和高阶编码后,使用对比学习技术进行模型参数训练,最后使用训练好的模型输出查询结点对应图分区的低阶编码矩阵,并采用图搜索算法确定查询节点的社区结果;本发明方法不仅可以自动提取数据集的潜在特征,减少人工标注的成本,而且能有效内存消耗低,处理大规模图时效率较高。

Patent Agency Ranking