-
公开(公告)号:CN117933341A
公开(公告)日:2024-04-26
申请号:CN202410319788.6
申请日:2024-03-20
IPC: G06N3/082 , G06N3/0464
Abstract: 本发明提供一种基于同配性增强的图神经网络方法,涉及机器学习和深度学习技术领域。该方法具体包括:获取原始图的图数据,计算图数据中各节点的度并选取脆弱节点,选取需要删除边的节点,进而选定原始图中需要删除的边,构建增强后的同配图;训练条件变分自编码器,并利用训练好的条件变分自编码器生成增广特征矩阵,采用有监督损失函数计算预测结果;采用梯度下降更新训练好的条件变分自编码器中的生成参数,并开始迭代直至生成参数收敛为止,选择符合精度要求的增广特征矩阵,并利用级联的卷积层确定特征表示矩阵,再将其输入残差网络得到最终的预测结果,完成节点的分类;本发明通过增强图的同配性以提高图神经网络的鲁棒性和泛化能力。
-
公开(公告)号:CN117473391A
公开(公告)日:2024-01-30
申请号:CN202311517792.5
申请日:2023-11-14
Applicant: 东北大学
IPC: G06F18/241 , G06F18/213 , G06F18/23 , G06Q50/04 , G06N3/0475 , G06N3/094 , G06F40/30 , G06N3/084
Abstract: 本发明设计一种针对多渠道制造业数据的文本投毒检测方法,首先获取产业链多渠道制造业数据作为原始样本集,将原始样本集输入到预训练语言模型中,提取样本文本中的关键词,作为后续文本特征提取过程的依据;然后提取获取的原始样本集的文本特征,即获取原始样本集在预训练语言模型的最后一层的隐藏状态,用于提取样本在文本空间中特定位置的特征;根据得到的文本特征来检测对抗样本,对原始样本集进行分类,对检测出的对抗样本进行标记;对标记后的对抗文本做迭代净化,若在迭代次数上限内成功净化则存放在数据库内,否则弃用该样本;本方法不需要对每个攻击算法进行训练或验证集,就能获得较好的文本投毒检测效果和对抗防御性能。
-
公开(公告)号:CN110750560B
公开(公告)日:2023-02-03
申请号:CN201911021143.X
申请日:2019-10-25
IPC: G06F16/2453
Abstract: 本发明公开一种优化网络多连接的系统和方法,属于大数据处理技术领域。该系统包括基于数据字典的连接预算模块和逻辑图重构模块,其中基于数据字典的连接预算模块包括等深直方图生成单元和统计信息管理单元,并基于数据字典设计连接预算模型来描述数据分布质量s,用于连接逻辑图重构模块;逻辑图重构模块又分为连接顺序重排单元和DAG重构单元,运用该系统进行网络多连接优化的方法采用了启发式MMAS算法,保证在相对低的时间复杂度内得到近似最优解,大幅降低了多数据集连接计算的时间,解决现有技术中无法自动优化多连接顺序的问题,能够有效地减少程序的执行时间和网络传输、IO吞吐。
-
公开(公告)号:CN112527483B
公开(公告)日:2022-06-10
申请号:CN202011473342.7
申请日:2020-12-15
Abstract: 本发明提供一种Gaia系统中基于数据特征的动态优先级迭代器,涉及分布式大数据计算技术领域。该迭代器包括优先级调度模块、全量迭代计算模块和增量迭代计算模块;优先级调度模块读取数据源的数据作为迭代计算的初始工作集,并在每次迭代任务执行过程中维护一个用于查找和选择数据单元的跳表,以及一个用于保存数据单元对应的状态信息的状态表;并在每次迭代任务开始时按照优先级调整公式来更新状态表,当本次迭代任务所输入的数据单元全部更新完后,确定每个数据单元的优先级;Gaia系统则根据各个数据单元的优先级信息进行迭代计算;全量迭代模块由BulkIterate算子实现迭代计算,增量迭代模块由Delta Itreate算子实现迭代计算。
-
公开(公告)号:CN112527483A
公开(公告)日:2021-03-19
申请号:CN202011473342.7
申请日:2020-12-15
Abstract: 本发明提供一种Gaia系统中基于数据特征的动态优先级迭代器,涉及分布式大数据计算技术领域。该迭代器包括优先级调度模块、全量迭代计算模块和增量迭代计算模块;优先级调度模块读取数据源的数据作为迭代计算的初始工作集,并在每次迭代任务执行过程中维护一个用于查找和选择数据单元的跳表,以及一个用于保存数据单元对应的状态信息的状态表;并在每次迭代任务开始时按照优先级调整公式来更新状态表,当本次迭代任务所输入的数据单元全部更新完后,确定每个数据单元的优先级;Gaia系统则根据各个数据单元的优先级信息进行迭代计算;全量迭代模块由BulkIterate算子实现迭代计算,增量迭代模块由Delta Itreate算子实现迭代计算。
-
公开(公告)号:CN110795265A
公开(公告)日:2020-02-14
申请号:CN201911021197.6
申请日:2019-10-25
Abstract: 本发明公开一种基于乐观容错方法的迭代器,属于大数据环境下的分布式迭代计算技术领域,该迭代器包括增量迭代器和批量迭代器,综合考虑了不同大小的迭代任务和不同故障率的迭代计算任务,引入一个补偿函数,系统使用该函数重新初始化丢失的分区。发生故障时,系统暂停当前迭代,忽略失败的任务,并将丢失的计算重新分配给新获取的节点,调用分区上的补偿函数以恢复一致状态并恢复执行。对于故障频率较低的情况,大大减少了计算的延迟,提高了迭代处理效率。对于故障频率较高的情况,该迭代器可以保证迭代处理效率不低于优化前的迭代器。该乐观容错迭代器不用添加任务额外的操作,有效降低了容错开销。
-
公开(公告)号:CN110750560A
公开(公告)日:2020-02-04
申请号:CN201911021143.X
申请日:2019-10-25
IPC: G06F16/2453
Abstract: 本发明公开一种优化网络多连接的系统和方法,属于大数据处理技术领域。该系统包括基于数据字典的连接预算模块和逻辑图重构模块,其中基于数据字典的连接预算模块包括等深直方图生成单元和统计信息管理单元,并基于数据字典设计连接预算模型来描述数据分布质量s,用于连接逻辑图重构模块;逻辑图重构模块又分为连接顺序重排单元和DAG重构单元,运用该系统进行网络多连接优化的方法采用了启发式MMAS算法,保证在相对低的时间复杂度内得到近似最优解,大幅降低了多数据集连接计算的时间,解决现有技术中无法自动优化多连接顺序的问题,能够有效地减少程序的执行时间和网络传输、IO吞吐。
-
公开(公告)号:CN119089935A
公开(公告)日:2024-12-06
申请号:CN202411575701.8
申请日:2024-11-06
Applicant: 东北大学
IPC: G06N3/042 , G06N3/08 , G06F18/22 , G06F18/214
Abstract: 本发明公开一种基于图异常检测的多渠道数据监控范围调整方法,涉及制造业数据监控技术领域。本发明使用深度学习技术识别多渠道数据当中出现的异常,充分利用了渠道数据间的管理关系,避免了人工筛选、简单统计导致的识别不准确问题,同时根据识别的异常自适应地调整数据监控的范围,使监控能自适应的聚焦到易发生异常的环节,提高对异常渠道数据的识别能力,高效、动态的监控制造业多渠道数据,维护产业链的循环畅通,适用于当今大规模产业链的监控应用,同时提高了监控的效率、聚焦能力,更好的维护产业链的稳定运行。
-
公开(公告)号:CN118509304A
公开(公告)日:2024-08-16
申请号:CN202410584137.X
申请日:2024-05-11
IPC: H04L41/0631 , H04L41/142 , G06N3/045 , G06N3/0464 , G06N3/048 , G06N3/08 , G06F18/22 , G06F17/18 , G06F17/16
Abstract: 本发明公开了基于个性化PageRank和对比学习的属性网络异常节点检测方法,属于异常节点检测领域。提出基于PPR的自适应采样策略,根据属性网络中不同节点的中心性选择适配的子图规模并获得局部结构信息,以解决固定采样策略造成的上下文信息缺失或引入噪声进而导致降低检测准确度的问题。利用K最近邻算法单独从属性空间中寻找属性网络的节点最近邻居并获得全局属性信息,充分捕获节点的属性特征额外提供的异常信息。从局部结构和全局属性两个角度构建两个对比范式,并设计了直接针对异常节点检测的对比学习损失函数和异常值计算公式,既考虑子图蕴含的上下文信息与节点信息的一致性,还考虑了属性空间的一致性,提高了检测准确度。
-
公开(公告)号:CN118070894A
公开(公告)日:2024-05-24
申请号:CN202410017408.3
申请日:2024-01-05
Applicant: 东北大学
IPC: G06N5/025 , G06F16/36 , G06F40/30 , G06F40/289
Abstract: 本发明提供一种面向销售领域的事理知识图谱的构建方法,涉及人工智能技术领域,本发明将事件按照按照产品从源头到后续运营卖出的流程进行归类,形成了全面的销售事件类型,根据中文特有结构分别关注销售动作和销售重点信息形成之间的特征表示。通过融入句子之间相似度占比权重,生成了更为丰富的销售潜在背景信息,形成最后的事件表示向量。事理关系抽取部分采用显式方式,并根据抽取出的关系进行合并与销售领域因果传递性的推理,保证图谱事件的全面和准确性。最后构建的事理图谱包含了传统图谱没有的全链路的信息与脉络。融合历史行业信息的图谱进入神经网络,包含了外部信息的网络为下游预测提供更丰富的外部信息与理论依据。
-
-
-
-
-
-
-
-
-