一种针对多渠道制造业数据的文本投毒检测方法

    公开(公告)号:CN117473391A

    公开(公告)日:2024-01-30

    申请号:CN202311517792.5

    申请日:2023-11-14

    Applicant: 东北大学

    Abstract: 本发明设计一种针对多渠道制造业数据的文本投毒检测方法,首先获取产业链多渠道制造业数据作为原始样本集,将原始样本集输入到预训练语言模型中,提取样本文本中的关键词,作为后续文本特征提取过程的依据;然后提取获取的原始样本集的文本特征,即获取原始样本集在预训练语言模型的最后一层的隐藏状态,用于提取样本在文本空间中特定位置的特征;根据得到的文本特征来检测对抗样本,对原始样本集进行分类,对检测出的对抗样本进行标记;对标记后的对抗文本做迭代净化,若在迭代次数上限内成功净化则存放在数据库内,否则弃用该样本;本方法不需要对每个攻击算法进行训练或验证集,就能获得较好的文本投毒检测效果和对抗防御性能。

    一种分布式环境下基于社会感知的空间关键字查询方法

    公开(公告)号:CN108932347B

    公开(公告)日:2021-11-16

    申请号:CN201810875808.2

    申请日:2018-08-03

    Applicant: 东北大学

    Abstract: 本发明公开了一种分布式环境下基于社会感知的空间关键字查询方法,通过对Top‑k查询问题进行分析,提出解决该问题的索引和查询框架,索引结构引入了社交信息,利用关键字的检索特点,在SDPR分布式索引结构的基础上提出基于的社会感知的Top‑k查询算法,通过输入查询参数,结果是数据集中满足特定排序函数排名最高的前k个对象,通过带有权重的空间关键字查询,使得查询更加精准,能够得到更加准确的结果。

    一种面向海洋大数据的并行关联规则挖掘方法

    公开(公告)号:CN113010597A

    公开(公告)日:2021-06-22

    申请号:CN202110368784.3

    申请日:2021-04-06

    Applicant: 东北大学

    Abstract: 本发明提供一种面向海洋大数据的并行关联规则挖掘方法,包括海洋大数据预处理、海洋数值大数据离散化处理及并行关联规则挖掘三部分,数据离散化采用信息熵结合K‑means的方法,并行关联规则挖掘主要基于改进Apriori算法来完成,即基于Spark并行化Apriori算法,并将事务矩阵引入到了并行处理中,在迭代计算中简化事务矩阵,通过矩阵做逻辑“与”运算得到频繁项集和支持度,通过频繁项集与支持度计算关联规则。在计算过程中仅对该RDD进行操作,而不再扫描原始数据,从而通过内存计算加快了算法处理效率。通过剪枝来简约事务矩阵,减少后续迭代扫描范围和计算量,减少了I/O操作,有效解决了现有方法满足不了海洋大数据关联挖掘分析需求的问题。

    一种社交网络文本数据的索引方法

    公开(公告)号:CN107153687B

    公开(公告)日:2021-01-05

    申请号:CN201710281671.3

    申请日:2017-04-18

    Applicant: 东北大学

    Abstract: 本发明公开了一种社交网络文本数据的索引方法,包括获取需求用户的地理位置,根据需求用户输入的需求,对社交网络中的文本数据进行分词处理,获取与需求用户的需求相匹配的关键词组;根据所获取的关键词组,建立索引树DLIR‑Tree;根据需求用户的需求、地理位置及区域半径查询索引树DLIR‑Tree,得到相应的文本数据。考虑文本数据和地理位置的混合索引结构,简称DLIR‑Tree,以便于根据用户的需求快速搜索得到符合需求及在区域范围内与关键词组相关的文本信息,并且能够通过边界评分方式提供搜索空间的剪枝能力,通过利用地理位置已经查询的需求建立索引,增大了索引能力,减低了索引的数据处理量,提供了工作效率。

    一种基于路径信息的可扩展标记语言祖先后代索引方法

    公开(公告)号:CN102043852B

    公开(公告)日:2012-07-18

    申请号:CN201010600979.8

    申请日:2010-12-22

    Applicant: 东北大学

    Abstract: 一种基于路径信息的可扩展标记语言祖先后代索引方法,包括以下步骤:步骤一:解析XML文档;步骤二:建立B+树索引;步骤三:使用B+树索引进行祖先后代关系查询。本发明是一个实用的索引,基于计算机数据库领域内的B+树结构,该结构保证了在绝大多数情况下,采用索引都会比不采用索引查询效率有很大的提高,该索引无论对于基于关系数据库的XML数据库管理系统还是基于Native存储的XML数据库管理系统,都易于实现;该结构实现简单,只需要进行一次节点扫描,对于文档的数据是否有数据倾斜状况,都有很好的性能;还可以很好的处理A1//A2//…//An这类复杂的路径查询,避免了把长路径分成若干个祖先后代对的做法,有效的实现了对索引节点一次扫描即可得到查询结果。

    一种基于图异常检测的多渠道数据监控范围调整方法

    公开(公告)号:CN119089935A

    公开(公告)日:2024-12-06

    申请号:CN202411575701.8

    申请日:2024-11-06

    Applicant: 东北大学

    Abstract: 本发明公开一种基于图异常检测的多渠道数据监控范围调整方法,涉及制造业数据监控技术领域。本发明使用深度学习技术识别多渠道数据当中出现的异常,充分利用了渠道数据间的管理关系,避免了人工筛选、简单统计导致的识别不准确问题,同时根据识别的异常自适应地调整数据监控的范围,使监控能自适应的聚焦到易发生异常的环节,提高对异常渠道数据的识别能力,高效、动态的监控制造业多渠道数据,维护产业链的循环畅通,适用于当今大规模产业链的监控应用,同时提高了监控的效率、聚焦能力,更好的维护产业链的稳定运行。

    一种面向销售领域的事理知识图谱的构建方法

    公开(公告)号:CN118070894A

    公开(公告)日:2024-05-24

    申请号:CN202410017408.3

    申请日:2024-01-05

    Applicant: 东北大学

    Abstract: 本发明提供一种面向销售领域的事理知识图谱的构建方法,涉及人工智能技术领域,本发明将事件按照按照产品从源头到后续运营卖出的流程进行归类,形成了全面的销售事件类型,根据中文特有结构分别关注销售动作和销售重点信息形成之间的特征表示。通过融入句子之间相似度占比权重,生成了更为丰富的销售潜在背景信息,形成最后的事件表示向量。事理关系抽取部分采用显式方式,并根据抽取出的关系进行合并与销售领域因果传递性的推理,保证图谱事件的全面和准确性。最后构建的事理图谱包含了传统图谱没有的全链路的信息与脉络。融合历史行业信息的图谱进入神经网络,包含了外部信息的网络为下游预测提供更丰富的外部信息与理论依据。

    一种社交网络文本数据的索引方法

    公开(公告)号:CN107153687A

    公开(公告)日:2017-09-12

    申请号:CN201710281671.3

    申请日:2017-04-18

    Applicant: 东北大学

    Abstract: 本发明公开了一种社交网络文本数据的索引方法,包括获取需求用户的地理位置,根据需求用户输入的需求,对社交网络中的文本数据进行分词处理,获取与需求用户的需求相匹配的关键词组;根据所获取的关键词组,建立索引树DLIR‑Tree;根据需求用户的需求、地理位置及区域半径查询索引树DLIR‑Tree,得到相应的文本数据。考虑文本数据和地理位置的混合索引结构,简称DLIR‑Tree,以便于根据用户的需求快速搜索得到符合需求及在区域范围内与关键词组相关的文本信息,并且能够通过边界评分方式提供搜索空间的剪枝能力,通过利用地理位置已经查询的需求建立索引,增大了索引能力,减低了索引的数据处理量,提供了工作效率。

    一种基于位置的社交网络中Top‑k区域用户文本数据推荐方法

    公开(公告)号:CN107145545A

    公开(公告)日:2017-09-08

    申请号:CN201710281672.8

    申请日:2017-04-18

    Applicant: 东北大学

    Abstract: 本发明公开了一种基于位置的社交网络中Top‑k区域用户文本数据推荐方法,包括:获取需求用户的地理位置,根据需求用户输入的需求,对社交网络中的文本数据进行分词处理,获取与需求用户的需求相匹配的关键词组;根据所获取的关键词组,建立索引树DLIR‑Tree,所述索引树DLIR‑Tree的每个节点包含一系列的社交网络文本的发送用户;根据需求用户的需求、地理位置及区域半径查询索引树DLIR‑Tree,得到相匹配的文本数据;对所获取的文本数据与关键词组进行相似度计算处理,得到过滤后的文本数据;根据过滤后的文本数据,进行综合评分,并根据综合评分完成Top‑k区域用户文本数据推荐。通过信息的全面性和多样性来实现现实社会的真实情况,从而使得推荐信息准确率得到提高。

    面向大规模不确定物流网络的需求概率查询方法

    公开(公告)号:CN102799674B

    公开(公告)日:2015-02-18

    申请号:CN201210248045.1

    申请日:2012-07-17

    Applicant: 东北大学

    Abstract: 一种面向大规模不确定物流网络的需求概率查询方法,采用不确定图G来描述不确定物流网络,计算配送量在不确定物流网络中从源节点到汇聚节点被成功配送的概率,具体是不确定图G的需求概率查询,得到物流网络数据的需求概率的查询结果,即配送量在不确定物流网络中从源节点到汇聚节点被成功配送的概率,不断更新需求概率,进行下一次查询;根据计算出的结果,制定物流配送线路进行物流配送。采用本方法来处理物流网络的不确定性,能够提高运输效率减少成本。

Patent Agency Ranking