-
公开(公告)号:CN109901932B
公开(公告)日:2023-04-07
申请号:CN201910185650.0
申请日:2019-03-12
Applicant: 东北大学
Abstract: 本发明公开了一种基于虚拟机的服务器整合方法,所述基于虚拟机的服务器整合方法包括基于动态阈值的服务器局部整合算法和基于遗传算法的服务器全局整合算法。本发明科学合理,使用安全方便,通过局部整合和全局整合,可以有效地实现依据云数据中心负载变化动态来进行服务器整合的重要功能,从而提升业务支撑能力和运维效率、降低投资和决策风险,达到节省投资和节约能源的目的。提出的服务器局部整合算法的目标是对处于高载状态和低载状态的服务器进行小范围内的局部整合,满足节能要求;服务器全局整合算法的目标是在更大范围内对服务器进行整合,在保证服务质量的同时使虚拟机运行在尽可能少的服务器上,从而提升整体资源利用率和降低能源消耗。
-
公开(公告)号:CN115062623A
公开(公告)日:2022-09-16
申请号:CN202210661594.5
申请日:2022-06-10
Applicant: 东北大学
Abstract: 本发明涉及文本内容的情感抽取模型技术领域,尤其涉及交互式属性术语及情感联合抽取模型的方法。其主要针对现有应用难以有效学习属性术语的特征,属性术语及情感联合抽取的研究内容匮乏的问题,提出如下技术方案:包括属性术语抽取模块、情感分类模块和交互共享单元,包括以下步骤:步骤1:获取句中单词的情感倾向;步骤2:交互共享单元让两个模块互相学习;步骤3:属性术语抽取任务标签和情感分类任务标签结合。本发明充分地利用外部情感资源,两阶段处理增强的情感分析,提高语句中情感抽取的精确性,交互共享单元提高模块学习效果,有助于特征向量的结果预测,主要应用于属性术语及文本情感联合抽取。
-
公开(公告)号:CN112182152B
公开(公告)日:2021-09-03
申请号:CN202011013190.2
申请日:2020-09-24
Applicant: 东北大学
IPC: G06F16/33 , G06F16/35 , G06F40/289 , G06N3/04 , G06N3/08
Abstract: 本发明提供提出了基于深度学习的新浪微博用户情感影响力分析方法,包括数据获取、数据预处理、构建多元情感特征词向量、文本进行情感分类和定义微博用户情感影响力,本发明中通过使用MSF‑CNN算法对微博文本进行情感分析能力高于w2c‑CNN算法,能很好的配合微博中书写自由、用词随意的语言环境,能很好的考虑微博文本的上下语境,提取出文本特征,同时考虑词语自身所携带的情感,能更好的进行情感分类。
-
公开(公告)号:CN109947904B
公开(公告)日:2021-07-30
申请号:CN201910222188.7
申请日:2019-03-22
Applicant: 东北大学
Abstract: 本发明公开了一种基于Spark环境的偏好空间Skyline查询处理方法,包括基于偏好函数的空间Skyline查询处理算法和基于偏好优先的空间Skyline查询处理算法,本发明科学合理,使用安全方便,通过基于偏好函数的空间Skyline查询处理算法的作用,将数据的空间属性与非空间属性相整合,并利用相关性对不满足任一查询点偏好的数据进行过滤,减少了数据集的大小,利用网格支配关系进一步减少处理任务量,提高了查询的处理速度;通过基于偏好优先的空间Skyline查询处理算法的作用,对空间数据进行聚类,并将类中出现频率较高的关键词作为整个类的文本特征信息,同时对类中的空间对象建立扩展的R‑tree索引,利用扩展R‑tree索引的高效空间查找和过滤能力进行支配判断,从而加快Skyline查询处理。
-
公开(公告)号:CN113010597A
公开(公告)日:2021-06-22
申请号:CN202110368784.3
申请日:2021-04-06
Applicant: 东北大学
IPC: G06F16/26 , G06F16/2458 , G06F16/182 , G06K9/62 , G06N3/04
Abstract: 本发明提供一种面向海洋大数据的并行关联规则挖掘方法,包括海洋大数据预处理、海洋数值大数据离散化处理及并行关联规则挖掘三部分,数据离散化采用信息熵结合K‑means的方法,并行关联规则挖掘主要基于改进Apriori算法来完成,即基于Spark并行化Apriori算法,并将事务矩阵引入到了并行处理中,在迭代计算中简化事务矩阵,通过矩阵做逻辑“与”运算得到频繁项集和支持度,通过频繁项集与支持度计算关联规则。在计算过程中仅对该RDD进行操作,而不再扫描原始数据,从而通过内存计算加快了算法处理效率。通过剪枝来简约事务矩阵,减少后续迭代扫描范围和计算量,减少了I/O操作,有效解决了现有方法满足不了海洋大数据关联挖掘分析需求的问题。
-
公开(公告)号:CN110223125B
公开(公告)日:2021-06-11
申请号:CN201910528745.8
申请日:2019-06-18
Applicant: 东北大学
Abstract: 本发明公开了节点位置核边收益算法下用户位置获取方法,包括如下步骤:S1、处理捕获的数据集;S2、带权有向图;S3、使用算法求出种子节点集;S4、使用种子节点集在传播模型规定下模拟信息传播;S5、得出最终受影响的用户数,本发明结构科学合理,使用安全方便,该启发因子改进了k‑核的概念,也结合了本文对用户位置签到信息的研究成果,能较为全面的反应出一个节点在社交网络中拥有的影响力大小,为本文最后提出解决社交网络中基于位置的影响最大化问题算法做准备,当得到位置访问概率函数与节点位置核边收益因子后,本文提出了位置核边收益算法,该算法能相对较好的克服了节点区域重叠问题,比其他启发式算法具有更高的准确度。
-
公开(公告)号:CN108804415A
公开(公告)日:2018-11-13
申请号:CN201810477586.9
申请日:2018-05-18
Applicant: 东北大学
CPC classification number: G06F17/2785 , G06F17/274 , G06K9/6277
Abstract: 本发明公开了一种本体调试信息的度量与排序方法,包括根据用户对辩解的认知,提取辩解的度量标准,所述度量标准包含复杂度、相关度及新颖度三方面;采用ListNet排序学习方法构造top k排序模型,根据该排序模型对特征化后的辩解进行排序,获取排序前k个易理解的辩解。从用户认知的角度提出一套度量OWL辩解的标准,该套标准综合考虑了复杂度、相关度和新颖度三方面,基于该套标准,构造一个top k排序模型,获取易理解的前k个辩解,帮助用户更好地进行本体不一致的解释工作,从而增强用户体验。
-
公开(公告)号:CN105046107B
公开(公告)日:2018-04-20
申请号:CN201510555372.5
申请日:2015-08-28
Applicant: 东北大学
IPC: G06F19/18
Abstract: 本发明公开了一种限定性模体的发现方法,涉及生物信息领域,包括以下步骤:1)构建字典表,所构述字典表用于存储指定模式P的模式实例;2)在字典表中以字典顺序列出指定模式P的所有实例集合I={I1…IN},其中,Ii为模体实例;3)对每个模体实例Ii与待检测的核苷酸序列进行比较验证,若第i个实例满足只出现在待检测的核苷酸正例序列集合中,而不出现在反例序列集合中,则该实例作为最终满足条件的模体输出。本发明以简单的方法解决了限定性模体发现问题,最后的实验证明,在合理的时间内,倒排索引算法总是可以找到所有满足条件的模体,从而保证了算法的有效性。
-
公开(公告)号:CN105159818B
公开(公告)日:2018-01-02
申请号:CN201510555374.4
申请日:2015-08-28
Applicant: 东北大学
Abstract: 本发明公开了一种内存数据管理中日志恢复方法及其仿真系统,涉及数据管理技术领域,包括以下步骤:1)、主节点获取集群节点的节点编号,并对所述集群节点发送数据写入命令,所述集群节点进行数据存储,主节点形成映射表;2)、主节点根据节点编号,向与所述集群节点匹配的日志节点发送集群节点日志命令,所述日志节点将日志存储,并将所述日志持久化,然后向主节点日志成功记录信息;3)、在集群节点发生故障时,停止事务执行,主节点获取故障节点的编号,获取日志节点中日志记录进行恢复,能够对集群节点中发生故障部分的节点进行自己恢复的状态并且不需要相互传递有关数据项的信息,降低了日志恢复的复杂性,提高日志恢复的速率和安全保障。
-
公开(公告)号:CN104298598B
公开(公告)日:2017-07-11
申请号:CN201410544602.3
申请日:2014-10-01
Applicant: 东北大学
IPC: G06F11/36
Abstract: 本发明公开了一种分布式环境下RDFS本体的调试方法,本发明首先运用字典编码技术对RDFS本体数据进行压缩处理,降低了数据的存储空间,同时加快了本体推理及调试的速度;之后实现了基于并行分布式计算框架Spark的RDFS本体推理算法,并将推理后的本体调试信息压缩后,存储在HBase分布式数据库中,为本体调试阶段的调试信息查询做准备;本发明实现了基于Spark框架的分布式增量存储更新算法;为了能在分布式环境下求取蕴含辩解,本发明对以往的方法进行了改进,并实现了两种蕴含辩解求取方法。
-
-
-
-
-
-
-
-
-